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(57) Abstract: The invention relates to a method for analyzing nucleic acid se- 
quences and gene expression. The method is based on the detection of fluores- 
cence signals of nucleotide molecules inserted into growing nucleic acid chains 
by means of a polymerase. The reaction occurs on a plane surface, wherein a plu- 
rality of individual nucleic acid molecules are immobilized on said surface. AH 
said nucleic acid molecules are exposed to the same conditions so that a build-up 
reaction can simultaneously take place in all nucleic acid molecules. 

(57) Zusammenfassung: Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaurekettensequenzen und der Genexpression. Grundlage der Methode 
ist die Detektion von Fluoreszenzsignalen einzelner, mit Farbstoffen markierter 
Nukleotidmolekiile, die durch eine Polymerase in wachsende Nukleinsaureketten 
eingebaut werden. Die Reaktion verlauft auf einer planen Oberflache. Auf dieser 
Oberflache sind viele einzelne Nukleinsaure-Molekule immobilisiert. Alle diese 
Nukleinsaure-Molekule sind gleichen Bedingungen ausgesetzt, so dass an alien 
Nukleinsaure-Molektilen gleichzeitig eine Aufbaureaktion ablaufen kann. 
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Verfahren zur Analyse von Nukleinsaurekettensequengen und der 
Genexpression 

Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaureketten und der Genexpression. Die Grundlage der 
Methode ist die Detektion von Fluoreszenzsignalen einzelner 
mit Farbstoffen markierter Nukleotidmolekule, die durch eine 
Polymerase in eine wachsende Nukleinsaurekette eingebaut 
werden. Die Reaktion verlauft auf einer planen Oberflache. An 
diese Oberflache sind viele einzelne Nukleinsaure-Molekiile 
gebunden. Alle diese Nukleinsaure-Molekule sind gleichen 
Bedingungen ausgesetzt, so dass an alien Nukleinsaure- 
Molekulen gleichzeitig eine Aufbaureaktion ablaufen kann. 

Das Verfahren umfaSt im wesentlichen folgende Schritte: 

1) Bindung der Nukleinsaurekettenf ragmenten (NSKFs) auf einer 
planen Oberflache mit anschlieSender Hybridisierung von 
Primern, alternativ Bindung von Primern mit anschlieSender 
Hybridisierung von NSKFs, so dass NSKF-Primer-Komplexe 
gebildet werden. 

2) Durchfuhren einer zyklischen Aufbaureaktion, wobei jeder 
Zyklus aus folgenden Schritten besteht: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs') 
und Polymerase zu den gebundenen NSKF- Primer - 
Komplexen, 

b) Inkubation der gebundenen NSKF-Primer-Komplexe mit 
dieser Losung unter Bedingungen, die zur Verlangerung 
der komplementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden, 

f) Waschen. 

Gegebenenfalls erfolgen mehrfache Wiederholungen des 
Zyklus . 

3) Analyse der detektierten Signale der einzelnen Molekule. 

4) Rekonstruktion der Sequenzen aus den Einzeldaten. 
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Abkurzunc ren und Begrif f serlauterunaen 

DNA - Desoxyribonukleinsaure verschiedenen Ursprungs und 
5 unterschiedlicher Lange (genomische DNA, cDNA, ssDNA, dsDNA) 

RNA - Ribonukleinsaure (meist mRNA) 

Polymerasen - Enzyme, die komplementare Nukleotide in einen 
0 wachsenden DNA- oder RNA- Strang einbauen kdnnen ( z.B. DNA- 
Polymerasen, Reverse -Transkriptasen, RNA- Polymerasen) 

dNTP - 2 1 -deoxi-Nucleosid-Triphosphate, Substrate fur DNA- 
Polymerasen und Reverse -Transkriptasen 

5 

NTP - Nukleosid-Triphosphate , Substrate fur RNA-Polymerasen 

NT - naturliches Nukleotid, meist dNTP, wenn nicht 
ausdrvicklich. anders gekennzeichnet . 

0 

Abkiirzung "NT" wird auch bei der Langenangabe einer 
Nukleinsauresequenz verwendet, z.B. 1.000 NT. In diesem Fall 
steht "NT" fur Nukleosid-Monophosphate . 

5 Im Text wird bei Abkurzungen die Mehrzahl durch Verwendung des 
Suffixes "s" gebildet, "NT" steht zum Beispiel fur 

"Nukleotid", "NTs" steht far mehrere Nukleotide. 

NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht 
D ausdrvicklich anders gekennzeichnet. NTs* bedeutet: 
modifizierte Nukleotide 

NSK - Nukleinsaurekette . DNA oder RNA in ihrer ursprunglichen 
Lange 

5 

NSKF - Nukleinsaurekettenf ragment (DNA oder RNA) , das einem 
Teil der Gesamtsequenz entspricht, NSKFs 
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Nukleinsaurekettenf ragmente . Die Summe der NSKFs bildet ein 
Aquivalent zur Gesamtsequenz . Die NSKFs kdnnen beispielsweise 
Fragmente von DNA- oder RNA-Gesamtsequenz sein, die nach 
einem Fragmentierungsschritt entstehen. 

Gesamtsequenz - die in der Sequenzierungsreaktion eingesetzte 
Sequenz oder die eingesetzten Sequenzen, meistens in NSKFs 
iiberfuhrt. Sie kann ursprunglich aus einer oder mehreren NSKs 
bestehen. Dabei kann die Gesamtsequenz Teile oder Aquivalente 
einer anderen Sequenz oder von Sequenz -Populatiohen 
darstellen (z.B. mRNA, cDNA, Plasmid-DNA mit Insert, BAC, 
YAC) und aus einer oder unterschiedlichen Spezies stammen. 

Primerbindungstelle (PBS) - Teil der Sequenz in der NSK oder 
NSKF, an den der Primer bindet . 

Referenzsequenz - eine bereits bekannte Sequenz, zu der die 
Abweichungen in der zu untersuchenden Sequenz bzw. in den zu 
untersuchenden Sequenzen (Gesamtsequenz) ermittelt werden. 
Als Referenzsequenzen kdnnen in Datenbanken zugangliche 
Sequenzen verwendet werden, wie z.B. aus der NCBI-Datenbank . 

Tm - Schmelztemperatur 

Plane Oberflache - Oberflache, die vorzugsweise folgende 
Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Molekvile, 
vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem 
jeweiligen gegebenen Objektiv-Oberf lache-Abstand bei einer 
Objektivposition gleichzeitig zu detektieren. 2) Die 
immobilisierten einzelnen Molekiile befinden sich in derselben 
Fokusebene, die reproduzierbar eingestellt werden kann. 

Weitfeld-Optik-Detektionssystem - Detektionssystem, das 
gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 
Flache verteilten Molekiilen detektieren kann, wobei die 
Flache ca. 100 iim 2 und groSer ist. Ein Beispiel fur Weitfeld- 
Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder 
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Axioplan 2e (Zeiss) mit einem Planneof luar-Objektiv lOOx NA 
1.4 Olimmersion (Zeiss), oder einem Planapochromat-Objektiv 
lOOx NA 1.4 Olimmersion (Zeiss); die Anregung der Fluoreszenz 
kann dabei mit einer Lampe, z.B. Quecksilberdampf lampe, oder 
einem Laser oder Dioden erfolgen. Sowohl Epif luoreszenzmdus 
als auch im Totalref lexions-Fluoreszenzmikroskopie -Modus 
(total internal reflection fluorescence microscopy, TIRF- 
Microscopy) oder Laser- Scanning-Mikroskopie -Modus konnen 
verwendet werden. In dieser Anmeldung wird Gebrauch von 
dieser Weitf eld-Detektionsoptik gemacht 

Definition der Termination: Als Termination wird in dieser An- 
meldung der reversible Stop des Einbaus der modif izierten 
ungespalteten NTs* bezeichnet. 

Dieser Begriff ist von dem iiblichen Gebrauch des Wortes 
"Termination" durch Dideoxy-NTP bei einer konventionellen 
Sequenzierung zu trennen . 

Die Termination kommt nach dem Einbau eines modif izierten NT* 
zustande. Ein zur Termination fiihrender Substituent- bzw. 
eine Modif ikation der 3 "-OH-Position an der Desoxyribose 
eines Nukleotides, die zur Termination fuhrt. Der Substituent 
kann unter milden Bedingungen abgespalten werden, so dafi 3"- 
OH Funktion wieder fur den Einbau eines NT* zur Verfugung 
steht. An diesen Substituenten ist ein Fluoreszenzf arbstof f 
gekoppelt . 

Genprodukte - Bei den Genprodukten handelt es sich urn die 
primaren Genprodukte der Gene. Im wesentlichen handelt es sich 
dabei urn RNA-Transkripte der genannten Gene, welche auch als 
Target -Sequenzen (oder Target -Nukleinsauresequenzen) 

bezeichnet werden. Diese Target -Sequenzen schlieSen neben mRNA 
auch davon abgeleitete einzelstrangige und doppelstrangige 
cDNA, von cDNA abgeleitete RNA oder von cDNA amplif izierte DNA 
ein. 



Einzelnukleotidpolymorphismen 



(single 



nucleotide 
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polymorphisms, SNPs) - Veranderungen in den Sequenzen, die 
als Substitution (Transition oder Transversion) oder als 
Deletion oder Insertion einzelner NT auftreten konnen. 



L Stand der Technik 

Die Nukleinsiurenketten-Sequenzanalyse und 

Genexpressionsanalyse sind in vielen Bereichen der 
Wissenschaft, Medizin und Industrie zu einem wichtigen Werk- 
zeug geworden. Zur Analyse wurden mehrere Verfahren 
entwickelt . 

Die bekanntesten Verfahren sind die Ketten- Terminations - 
Sequenzierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 
5463), die auf dem Einbau von Kettenterminatoren basiert, und 
die Maxam-Gilbert-Methode, die auf Basen-spezif ischer Modi- 
fikation und Spaltung von Nukleinsaureketten beruht (A.M. 
Maxam and W. Gilbert PNAS 1977, v. 74 S.560). Beide Methoden 
liefern eine Anzahl von Nukleinsaurekettenfragmenten 
verschiedener Langen. Diese Fragmente werden der Lange nach in 
einem Gel auf getrennt . Dabei miissen alle Nachteile der 
Elektrophorese (wie z.B. lange Laufzeit, relativ kurze 
Strecken von Sequenzen, die in einem Ansatz bestimmt werden 
konnen, begrenzte Anzahl der parallelen Ansatze sowie relativ 
groEe Mengen an DNA) in Kauf genommen werden. Diese Methoden 
sind sehr arbeitsintensiv und langsam. 

Ein wei teres Verfahren zur Sequenzierung basiert auf der 
Hybridisierung von Nukleinsaureketten mit kurzen 
Oligonukleotiden. Dabei wird mit mathematischen Methoden 
berechnet, wie viele Oligonukleotide einer bestimmten Lange 
vorhanden sein mussen, urn eine komplette Sequenz zu ermitteln 
(Z.T. Strezoska et al. PNAS 1991 v. 88 S. 10089, R.S.Drmanac et 
al. Science 1993 v. 260 S.1649). Auch dieses Verfahren ist mit 
Problemen behaftet: Es kann nur eine Sequenz in einem Ansatz 
bestimmt werden, sekundare Strukturen storen die 
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Hybridisierung unci Sequenzwiederholungen verhindern die 
korrekte Analyse. 

Eine andere Moglichkeit zur Sequenzierung haben Arbeitsgruppen 
beispielsweise von (Dower US Patent 5.547.839, Canard et al. 
US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 
1999, v.18 S.1021, Metzker et al. NAR 1994, v. 22, S.4259, 
Welch et al. Nucleosides & Nucleotides 1999, v. 18, S.197) 
entwickelt. Diese Methode wird abgekurzt als BASS (Base 
Addition Sequencing Scheme) oder SBS (Sequecing by Synthesis) 
bezeichnet. Dabei wird eine grofie Anzahl gleicher einzel- 
strangiger DNA-Stucke an einem definierten Ort auf einer 
Oberflache fixiert und das Signal von der Gesamtheit dieser 
vielen identischen DNA-Stucke analysiert. Zu dieser fixierten 
DNA wird eine Losung mit Polymerase und Nukleotiden zugegeben, 
so dass ein komplementarer Strang synthetisiert werden kann. 
Dabei soil die Polymerase schrittweise arbeiten: in jedem 
Schritt wird nur ein einziges Nukleotid eingebaut . Dieses wird 
detektiert, worauf die Polymerase in einem nachsten Zyklus das 
nachste Nukleotid einbaut. 

Trotz des Gelingens einiger einzelner Schritte der Methode 
wurde sie nicht zu einem funktionsf ahigen Verfahren 
entwickelt. Dies kann beispielsweise auf folgenden Tatsachen 
beruhen: Beim Aufbau der komplementaren Strange tritt sehr 
schnell eine Desynchronisation der Synthese auf, so dass bei 
jedem Schritt die Fehler akkumulieren. Deshalb konnen nur 
sehr kurze Fragmente sequenziert werden. Es ist zu betonen, 
dass alle beschriebenen BASS-Methoden nicht auf der Detektion 
von einzelnen Molekulen beruhen. Das Signal wird stattdessen 
von einer groSen Anzahl identischer an einem definierten Ort 
immobilisierter Molekule registriert. Die in diesen Methoden 
ubliche Verwendung der Begriffe "einzelne Molekule" und 
"Molekule" zielt dabei nicht auf individuelle, voneinander 
getrennte Molekule, sondern auf eine Population, die aus 
vielen identischen Molekulen besteht. Identisch heiEt in 
diesem Fall, dass die Molekule die gleiche Sequenz haben. 
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Die Analyse des Genexpressions-Spektrums ist zu einem 
wichtigen Werkzeug in der Wissenschaft geworden. Der Vergleich 
der Genexpressions-Spektren zwischen verschiedenen Zelllinien 
Geweben oder Entwicklungsstadien erlaubt Ruckschliisse auf die 
darin ablaufenden spezifischen biologischen Prozesse. So kann 
man z.B. erwarten, dass der Vergleich zwischen Tumorzellen und 
gesunden Zellen gleicher Herkunft Auskunft uber die am 
Tumorgeschehen beteiligten Gene gibt. Dabei ist wichtig, dass 
die Aktivitat moglichst vieler oder aller Gene gleichzeitig 
analysiert wird. 

Die Analyse der Genexpression ist eine komplexe Auf gabe : Die 
Anzahl der in einem Zelltyp aktiven Gene kann mehrere Tausend 
betragen. Die Analyse sollte aber moglichst alle im Genom der 
betreffenden Art enthaltenen Gene (etwa 32000 beim Menschen) 
beriicksichtigen. Hinzu kommt, dass die im jeweiligen Zellcyp 
aktxven Gene erstens meist noch nicht komplett bekannt sind 
und zweitens unterschiedlich stark exprimiert werden. 

Es warden bereits viele Methoden zur Genexpressionsanalyse 
entwickelt, so z.B. Differential Display (Nature 1984, v 308 
S.149, Science 1992 v.257 S.967), Expressed Sequence Tags 
(EST) (Science 1991 v. 252, S.1656, Nature Genetics 1992, v. 2 
S.173), Northern blotting oder RT-PCR (PNAS 1977, v. 74, 
S.5350, Cell 1983 v.34 S.865, "The PCR Technique, 'rt-PCR" 
1998, Ed. Paul Suebert, Eaton Publishing) . Alle diese Methoden 
konnen nur eine sehr begrenzte Anzahl an Genen pro Reaktion 
analysieren und sind zum Teil sehr arbeitsintensiv. 

Die am weitesten verbreitete Methode zur parallelen Analyse 
der Genexpressionsmuster ist die Hybridisierung eines zu 
analysierenden Gemischs von cDNA-Molekiilen mit an eine 
Oberflache gebundenen Oligonukleotiden, die in einer 
bestimmten Anordnung, meist als "Microarray" fixiert sind 
( "Microarray Biochip Technology" 2000, Ed. M.Schena, Eaton 
Publishing, Zhao et al. Gene 1995, v. 156, S.207, Schena et 
al. Science 1995 v. 270, S.467, Lockhart et al. US Patent 
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6.040.138, Wang US Patent 6.004.755, Arlinghaus et al. US 
Patent 5.821.060, Southern US Patent 5.700.637, Fodor et al. 
US Patent 5.871.928) . 

Zu den groSen Nachteilen der Hybridisierungsmethode zahlen: 
Die Fertigung der an die Oberflache gebundenen Oligonukleotide 
ist teuer. Die Analyse beschrankt sich auf Gene, deren 
Sequenzen bereits bekannt sind. Mehrere Mismatch-Kontrollen 
vergroSern die Anzahl der Oligonukleotide, die immobilisiert 
werden imissen. 

Die Aufgabe der vorliegenden Erfindung besteht daher darin, 
ein Verfahren zur Sequenz analyse von Nukleinsaureketten und 
der Analyse der Genexpression bereitzustellen, das die 
Nachteile der oben erwahnten Methoden nicht aufweist und vor 
allem eine billigere, schnellere und effizientere Analyse von 
Nukleinsauresequenzen ermoglicht. Insbesondere soil das 
Verfahren in der Lage sein, viele Sequenzen parallel zu 
bestimmen. Es kann dann beispielsweise fur die Analyse sehr 
langer Nukleinsaureketten (mehrere Mb) oder fur die 
Variantenalyse an vielen kurzen Ketten (Mutationsanalyse, SNP- 
Analyse) in einem Ansatz verwendet werden. 

iL_ Kurze Beschreibung 

Gegenstand der vorliegenden Erfindung ist ein Verfahren zur 
parallelen Sequenzanalyse von Nukleinsauresequenzen (Nu- 
kleinsaureketten, NSKs) gelost, bei dem man 

Fragment e (NSKFs) einzelstr<Sngiger NSKs mit einer Lange 
von etwa 50 bis 1000 Nukleotiden erzeugt, die uberlappende 
Teilsequenzen der Gesamtsequenzen darstellen, man 

die NSKFs unter Vei^endung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von NSKF- Primer- 
Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordniang bindet, man 
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eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
durchfuhrt, indem man 

a) zu den an die Oberflache gebundenen NSKF-Primer- 
Komplexen eine Ldsung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs*) enthalt, die mit Fluoreszenzf arbstof f en markiert 
sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstoffe so gewahlt sind, dass sich die ver- 
wendeten NTs* durch Messung unterschiedlicher Fluo- 
reszenzsignale voneinander unterscheiden lassen, wobei 
die NTs* strukturell so modifiziert sind, daS die Poly- 
merase nach Einbau eines solchen NT* in einen wachsenden 
komplementaren Strang nicht in der Lage ist, ein weite- 
res NT* in denselben Strang einzubauen, wobei der zur 
Termination fuhrende Substituent mit dem Fluores- 
zenzf arbstof f abspaltbar ist, man 



die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden , man 

die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs' geeignet sind, 
man 



die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
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der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fuhrenden Substituenten und die 
Fluoreszenzf arbstof fe von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzf arbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer-Komplexe 
auf der Reaktionsoberf lache und die Sequenz dieser NSKFs durch 
spezifische Zuordnung der in Stufe d) in auf einanderfolgenden 
Zyklen an den jeweiligen Posit ionen detektierten Fluores- 
zenzsignale zu den NTs bestimmt. 

Aus den ermittelten Teilsequenzen kann man beispielsweie die 
Gesamtsequenz der NSKs bestimmen. Unter einer parallelen 
Sequenzanalyse wird in diesem Zusammenhang die gleichzeitige 
Sequenzanalyse vieler NSKFs verstanden (beispielsweise 
1.000.000 bis 10.000.000), wobei diese NSKFs von einer 
einheitlichen NSK- Population oder von mehreren 
unterschiedlichen NSK- Populat ionen abgeleitet sind. 

Die erhaltene Population von viberlappenden Teilsequenzen lafit 
sich beispielsweise bei de novo Sequenzierung mit kommerziell - 

erhaltlichen Programmen zur Gesamtsequenz der NSK 
zusammenfugen (Huang et al. Genom Res. 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al . NAR 1995 v. 23 S.4992, 
Miller et al. J. Comput .Biol . 1994 v.l S.257). 

Bei der Analyse von Varianten einer bekannten Referenzsequenz 
lassen sich Mutationen oder Einzelnukleotidpolymorphismen 
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durch einen Vergleich der erhaltenen liberlappenden 
Teilsequenzen mit der Ref erenzsequenz f eststellen. 

Gemafi einer besonderen Ausfuhrungsf orm der Erf indung kann das 
Verfahren durchgefuhrt werden, indem man die Stufen a) bis f) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markier- 
te NTs* Oder 

c) in jedem Zyklus jeweils vier unterschiedlich markier- 

« 

te NTs* 

einsetzt . 

Wenn die NSKs Varianten einer bekannten Ref erenzsequenz sind 
kann das Verfahren auch durchgefuhrt werden, indem man die 
Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Gesamtsequenzen durch Vergleich mit der 
Ref erenzsequenz ermittelt. 

Gegenstand der vorliegenden Erfindung ist ferner ein Verfahren 
zur hoch parallelen Analyse der Genexpression, bei dem man 

einzelstrangige Genprodukte bereitstellt , man 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von Genprodukt- 
Primer-Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der Genprodukte unter Verwendung einer oder mehrerer 
Polymerasen durchf uhrt , indem man 
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a) zu den auf der Oberflache gebundenen Genprodukt- 
Primer-Komplexen eine Losung zugibt, die eine oder 
mehrere Polymerasen und ein bis vier modifizierte 
Nukleotide (NTs*) enthalt, die mit Fluoreszenzfarb- 
s toff en markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstof f e so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unt er schiedl icher Fluores z enz s ignale vone inander 
unterscheiden lassen, wobei die NTs* strukturell ' so 
modifiziert sind, daS die Polymerase nach Einbau 
eines solchen NT* in einen wachsenden komplementaren 
Strang nicht in der Lage ist, ein weiteres NT* in 
denselben Strang einzubauen, wobei der zur 
Termination fuhrende Substituent mit dem Fluores- 
zenzf arbstof f abspaltbar ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die kom- 
plementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in 
einen komplementaren Strang eingebauter NTs* ge- 
eignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzf arbstof f charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fuhrenden Substituenten mit den 
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Fluoreszenzf arbstof f en von . den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluores- 
zenzf arbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt- 
Primer-Komplexe auf der Reaktionsoberf lache und die 
Sequenz dieser Genprodukte durch spezifische Zuordnung 
der in Stufe d) in auf einanderf olgenden Zyklen an den 
jeweiligen Positionen detektierten Fluoreszenzsignale zu 
den NTs bestimmt und man aus den ermittelten Teilse- 
quenzen die Identitat der Genprodukte bestimmt. 

Bei den Genprodukten handelt es sich urn die primaren Gen- 
produkte der Gene, deren Expression analysiert werden soli. Im 
wesentlichen handelt es sich dabei urn RNA-Transkripte der 
genannten Gene, welche auch als Target -Sequenzen (oder Target - 
Nukleinsauresequenzen) bezeichnet werden. Diese Target- 
Sequenzen schlieSen neben mRNA auch davon abgeleitete 
einzelstrangige und doppelstrangige cDNA, von cDNA abgeleitete 
RNA oder von cDNA amplif izierte DNA ein. 

Die Genprodukte oder Target -Sequenzen konnen entweder als 
mRNAs direkt aus einer biologischen Probe (z.B. Zellextrakt, 
Gewebeextrakt oder Extrakt von ganzen Organismen) isoliert 
oder als cDNAs durch reverse Transkription der mRNAs erhalten 
werden . 

Unter einer hoch parallelen Analyse wird in diesem 
Zusammenhang die gleichzeitige Sequenzanalyse vieler 
Genprodukt-Molekule verstanden (beispielsweise 1.000.000 bis 
10.000.000), wobei diese Genprodukt-Molekfile eine komplexe 
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heterogene Population darstellen, die z.B. einem kompletten 
Expressionsprof il bzw. einem Expressionsspektrum eines Gewebes 
entspricht . 

GemaE einer besonderen Ausf iihrungs form der Erfindung kann das 
Verfahren durchgefuhrt werden, indem man die Stufen a) bis f) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markier- 
te NTs* oder 

c) in jedem Zyklus jeweils vier unterschiedlich markier- 
te NTs* 

einsetzt . 

Das Verfahren kann auch durchgefuhrt werden, indem man die 
Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Identitat der Genprodukte durch Vergleich 
mit den Ref erenzsequenzen ermittelt. 

Gegenstand der Erfindung ist ferner ein Kit zur Durchfuhrung 
des Verfahrens das eine Reaktionsoberf lache, zur Durchfuhrung 
des Verfahrens erf orderliche Reaktionslosungen, eine oder 
mehrere Polymerasen, und Nukleotide (NTs) enthalt, von denen 
ein bis vier mit Fluoreszenzf arbstof f en markiert sind, wobei 
die NTs* an der 3 1 -Position strukturell so modifiziert sind, 
da£ die Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage ist, ein 
weiteres NT* in denselben Strang einzubauen, wobei der zur 
Termination fuhrende Substituent mit dem Fluoreszenzf arbstof f 
abspaltbar ist. Gemafi einer besonderen Ausf uhrungsf orm der 
Erfindung enthalt das Kit ferner zur Erzeugung von 
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Einzelstrangen aus Doppelstrangen erforderliche Reagenzien, 
einzelstrangige Nukleinsauremolekule, die als PBS in die NSKFs 
eingefuhrt werden, Oligonukleotid- Primer, zur Abspaltung der 
Fluoreszenzfarbstoffe und der zur Termination fiihrenden 
Substituenten erforderliche Reagenzien und/oder Waschlosungen. 



Die erfindungsgemafie Methode dient zur Ermittlung der 
Nukleinsauresequenzen und kann in verschiedenen Bereichen der 
Genetik eingesetzt werden. Dazu zahlen insbesondere die 
Bestimmung unbekannter, langer Sequenzen, Analysen von 
Sequenz-Polymorphismen und Punktmutationen sowie die parallele 
Analyse einer groSen Zahl an Gensequenzen, sowie die Analyse 
der Genexpression. 

Bei der Analyse langer Nukleinsaureketten (z.B. 100 Kb und 
langer) hangt die Vorbereitung des zu analysierenden 
Materials (einzel- und doppelstrangige Nukleinsauresequenzen) 
von der Aufgabestellung ab und hat das Ziel, aus einer langen 
Nukleinsaurekette eine Population an relativ kleinen, 
einzelstrangigen Nukleinsaurekettenf ragmenten (NSKFs) zu 
bilden, diese Fragmente mit einem fur den Start der 
Sequenzierungsreaktion geeigneten Primer zu versehen (NSKF- 
Primer-Komplexe) und auf einer planen Oberflache zu fixieren. 

Dabei werden einzelne NSKFs auf einer planen Oberflache in 
einer solchen Weise fixiert, dass eine enzymatische Reaktion 
an diesen Molekiilen ablaufen kann. Prinzipiell sind 
verschiedene Arten der Immobilisation moglich, die von der 
Zielsetzung, der Art der NSK und der fur die Reaktion 
eingesetzten Polymerase abhangen. Die NSKFs werden bei der 
Iramobilisierung bzw. Bindung zufallig auf der Oberflache 
verteilt, d.h. es mufi also nicht auf eine exakte 
Positionierung der einzelnen Ketten geachtet werden. NSKF- 
Primer-Komplexe kdnnen uber die NSKFs oder Primer an die 
Oberflache gebunden werden. Die NSKF- Primer- Komplexe muss-en 
dabei in einer solchen Dichte auf der Oberflache fixiert 
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werden, dass eine eindeutige Zuordnung der sp&ter detektierten 
Signale von den eingebauten NT*s zu einzelnen NSKFs 
gewahrleistet ist . 

Nach der Vorbereitung der NSKFs startet man mit alien auf der 
Oberf lache immobilisierten NSKF - Primer - Kompl ex -Mo 1 ekiil en die 
Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient 
die Synthese des komplementaren Stranges zu jedem einzelnen 
gebundenen NSKF. Dabei werden in den neu synthetisierten 
Strang markierte NTs* eingebaut. Die Polymerase baut in eihem 
Zyklus nur ein einziges markiertes NT* in die wachsende Kette 
ein. 

Die Sequenzierungsreaktion verlauft in mehreren Zyklen. Ein 
Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu den gebundenen NSKF-Primer-Komplexen, 

b) Inkubation der gebundenen NSKF- Primer- Komplexe mit dieser 
Losung unter Bedingungen, die zur Verlangerung der kom- 
plementaren Strange um ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten Nukleotiden, 

f) Waschen. 

Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus 
(a-f ) . 

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus 
werden so gewahlt, dass die Polymerasen an mehr als 50% der an 
der Sequenzierungsreaktion beteiligten NSKFs (extensionsfahige 
NSKF - Primer - Komplexe ) in einem Zyklus ein markiertes NT* 
einbauen konnen, vorzugsweise an mehr als 90%. 

Die Anzahl der durchzufuhrenden Zyklen hingt dabei von der je- 
weiligen Aufgabenstellung ab, ist theoretisch nicht beschrankt 
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und liegt vorzugsweise zwischen 20 und 5000. 

Danach wird fur jedes fixierte NSKF seine spezifische Sequenz 
aus der Reihenfolge der eingebauten NTs* ermittelt . 

Aus den uberlappenden NSKF-Sequenzen kann in einer 
Ausfuhrungsform die urspriingliche NSK- Sequenz rekonstruiert 
werden ("Automated DNA sequencing and analysis" S. 231 ff. 
1994 M. Adams et al. Academic Press , Huang et al. Genom Res. 
1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v.23 S.4992, Miller et al. J.Comput .Biol . 1994 v.l 
S.257) . Dabei sucht man in der gesamten Population von NSKF- 
Sequenzen nach Ubereinstimmungen/Uberlappungen in den 
Sequenzen von NSKFs . Durch diese 

Ubereinstimmungen/Uberlappungen kann man die NSKF in eine 
Reihe bringen, z . B . : 

ACTGTGCGTCCGTATGATGGTCATTCCATG 

CATTCCATGGTACGTTAGCTCCTAG 

TCCTAGTAAAATCGTACC . 



In der Praxis hat sich bei einer Sequenzierung von unbekannten 
Sequenzen bewahrt, eine Lange der sequenzierten Stucke von 
mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung 
von Genomen aus Eukaryonten i m Schrotschuss-Verf ahren. 

Dabei konnen die Fehler der Methode mit verschiedenen Mitteln 
erfasst und korrigiert werden. Samtliche Schritte des 
Verfahrens konnen weitgehend automat isiert werden. 

Durch die Arbeit mit einzelnen Molekulen ergeben sich groSe 
Vorteile gegenuber der friiher beschriebenen BASS-Methode : 

1. Da die Molekule einzeln detektiert werden, besteht keine 
Gefahr, dass das Signal durch die Desynchronisation in der 
Population fehlerhaft wird. Fur jedes fixierte NSKF wird 
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eine eigene Sequenz erstellt. Daher spielt es keine Rolle, 
ob an einem benachbarten Molekiil die Synthese bereits 
weiter fortgeschritten oder zuriickgeblieben ist. Dadurch 
wird eine hoch parallele Sequenzierung langer NSKF erst 
moglich. 

2. Es ist nicht notwendig, Molekule in einer definierten 
Anordnung auf der Oberflache zu fixieren, da das Signal 
von einzelnen Molekiilen ausgeht und nicht von einer 
raumlich definierten Population (was bei BASS-Methoden 
notwendig ist) . 

3- Es ist nicht zwingend notwendig multiple * Kopien von den zu 
analysierenden Nukleinsaureketten herzustellen, so dass 
PCR- und bzw. oder Klonierungsschritte ent fallen konnen. 
Dies fiihrt zu einer enormen Beschleunigung der Analyse im 
Vergleich zu bestehenden Verfahren. 

Das erf indungsgemafie Verfahren zur Analyse der Genexpression 
erhalt durch eine gleichzeitige Sequenzierung einzelner 
Genprodukt molekule mehrere Vorteile gegenuber bekannten 
Methoden der Analyse der Genexpression: 

1) Die Genprodukte konnen in einer beliebigen Anordnung auf 
der Oberflache binden. Eine vorherige aufwendige Synthese von 
verschiedenen Oligonukleotiden an bestimmten Positionen (wie 
beispielsweise bei der Hybridisierungsmethode) ist somit 
nicht notwendig. 

2) Das Material kann auf einer standardisierten Oberflache 
analysiert werden. 

3) Auch die Expression noch unbekannter Gene kann ermittelt 
werden, weil alle im Ansatz enthaltenen Genprodukte 
analysiert werden. 

4) . Die groBe Anzahl. der analysierten Molekule erlaubt auch 
die Detektion schwach exprimierter Gene. 

5) Kleinste Mengen an Ausgangsmaterial konnen eingesetzt 
werden: mRNA aus einer einzelnen Zelle kann fur die Analyse 
ausreichend sein. 
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6) Samtliche Schritte des Verfahrens konnen weitgehend 
automat isiert werden. 

Die Methode basiert auf mehreren Prinzipien: 

1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genugend 
Informationen zur Identif izierung des korrespondierenden Gens, 
wenn die Gensequenz selbst bereits in einer Datenbank 
enthalten ist. 

Eine Sequenz aus beispielsweise 10 NTs kann mehr als 10 6 
verschiedene Kombinationen bilden. Das ist z.B. fur die 
meisten Gene im menschlichen Genom, das nach heutiger 
Schatzung 32000 Gene entMlt, ausreichend. Fur Organismen mit 
weniger Genen kann die Sequenz noch kurzer sein. 

2. Der Methode liegt ein neues Verfahren zur die Sequenzierung 
einzelner Nukleinsaurekettenmolekule zugrunde. 

3. Es konnen Nukleinsaureketten-Gemische untersucht werden. 

4. Die Sequenz ierungsreakt ion lauft an vielen Molekulen 
gleichzeitig ab, wobei die Sequenz jeder einzelnen gebundenen 
Nukleinsaurekette analysiert wird. 

Es ist bekannt, dass zur Untersuchung der Genexpression mRNAs 
oder von der mRNA abgeleitete Nukleinsaureketten (z.B. 
einzelstrangige cDNAs, doppelstrangige cDNAs, von cDNA 
abgeleitete RNA oder von cDNA amplif izierte DNA) eingesetzt 
werden kann. Unabhangig von der genauen Zusammensetzung werden 
sie im folgenden als Genprodukte ■ bezeichnet. Auch 
Teilsequenzen dieser Genprodukte werden im folgenden als 
Genprodukte bezeichnet. 

Diese Genprodukte stellen ein Gemisch aus verschiedenen Nu- 
kleinsaureketten dar. 

Als Grundlage der Analyse dient die Synthese eines zum 
Genprodukt komplementaren Stranges. 
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Das Ziel der Vorbereitung ist, auf einer planen Oberflache in 
zufalliger Weise gebundene Genprodukt-Primer-Komplexe 
bereitzustellen, an denen der Einbau von NT*s durch die 
Polymerase stattfinden kann (extensionsf ahige Genprodukt- 
Primer-Komplexe) . 

Mit diesen gebundenen Genprodukt-Primer-Komplexen wird die 
Sequenzierungsreaktion durchgef iihrt . 

Sie verlauft in mehreren Zyklen. Pro Zyklus wird jeweils nur 
ein einziges markiertes NT* in den wachsenden Strang 
eingebaut. Ein Zyklus umfasst folgende Schritte: 

a) Zugabe einer Ldsung mit markierten Nukleotiden (NTs') und 
Polymerase zu gebundenen Genprodukt-Primer-Komplexen, 

b) Inkubation der gebundenen Genprodukt-Primer-Komplexe mit 
dieser Ldsung unter Bedingungen, die zur Verlangerung der 
komplementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen modif izierten, in die 
neu synthetisierten Strange eingebauten NTs*-Molekulen, 

e) Entfernung der Markierung von den eingebauten Nukleoti- 
den, 

f) Waschen. 

Dieser Zyklus kann mehrmals wiederholt werden, so dass von 
jedem an der Sequenzierungsreaktion teilnehmenden Genprodukt- 
Primer-Komplex vorzugsweise 10 bis 50 NTs ermittelt werden. 
Danach erfolgt die Rekonstruktion der Nukleinsauresequenzen 
aus den detektierten Signalen. Die ermittelten Sequenzen der 
gebundenen Genprodukte werden zur Bestimmung der Abundanzen 
untereinander verglichen und durch Vergleich mit Gensequenzen 
in Datenbanken bestimmten Genen zugeordnet . 



4^ Detaillierte Besrhreibuna 

Allgemeine Prinzipien der Reaktion, Materialauswahl und 
Materialvorbereitung (Erzeugung kurzer NSKPs, Einfuhrung 
einer PBS, Einzelstrangvorbereitung, Primerauswahl , Fixierung 
von NSKFs) , sowie die Detektionsapparatur und Detektion 
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werden am Beispiel des Verfahrens zur Sequenzierung langer 
NSKs dargestellt. Das Verfahren zur Analyse der Genexpression 
wird anschliefiend im Beispiel 3 beschrieben. 

4.1 Allgemeine Prinzipien der Reaktion 

Im folgenden sollen anhand der Sequenzierung eines mehrere Mb 
langen DNA-Stiickes beispielhaft die allgemeinen Prinzipien der 
Reaktion dargestellt werden (Fig. 1) . Der Sequenzierung und 
der Rekonstruktion von Nukleinsaurensequenzen liegt das 
Shotgun- Prinzip zugrunde ("Automated DNA sequencing and 
analysis" S. 231 f f . 1994 M. Adams et al. Academic Press, 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput .Biol. 1994 v.l S.257). Die Sequenz eines langen DNA- 
Stucks wird dabei durch die Sequenzierung kleiner DNA- Frag - 
mente und nachf olgender Rekonstruktion ermittelt. Das zu 
analysierende Material (1) wird fur die Sequenzierungsreaktion 
vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 
1000 bp Lange zerlegt wird (2) . Jedes Fragment wird 
anschliefiend mit einer Primerbindungsstelle und einem Primer 
versehen (3) . Dieses Gemisch aus verschiedenen DNA- Fragment en 
wird nun auf einer planen Oberflache fixiert (4) . Die nicht 
gebundenen DNA- Fragmente werden durch einen Waschschritt 
entfemt. Danach wird die Sequenzierungsreaktion an der 
gesamten Reaktionsoberf lache durchgef uhrt . Diese Reaktion 
verlauft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem 
Fluoreszenzfarbstof f markiertes NT* in den wachsenden Strang 
eingebaut: Dabei wird die Reaktion so gesteuert, dass in jedem 
Zyklus jeweils nur ein markiertes NT* von einer Polymerase in 
den wachsenden Strang eingebaut werden kann. Das wird durch 
die Verwendung von NTs* erreicht, die an der 3 "-Position der 
Desoxyribose ein reversibel gekoppeltes, zur Termination 
fuhrenden Substituenten tragen. Der Einbau eines weiteren 
markierten NT* wird dadurch unmoglich gemacht. Die Polymerase 
und die markierten NTs* werden gleichzeitig in die Reaktion 
eigesetzt (5) .Danach wird das Reaktionsgemisch entfernt und 
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die Oberflache in geeigneter Art und Weise gewaschen (6) . Nun 
folgt ein Detektionsschritt (7) : Die Oberflache wird rnit einer 
fur die Einzelmolekuldetektion geeigneten Vorrichtung 
(bestehend aus Lichtquelle, Mikroskop, Kamera, Scant isch, 
Computer mit Steuerungs- und Bilderkennungs- bzw. Bild- 
verarbeitungs software) abgescannt und die Signale der 
einzelnen, eingebauten markierten NTs* ' i dent if iziert . Nach dem 
Detektionsschritt wird die Markierung und der zur Termination 
fuhrende Substituent von alien eingebauten NTs* entfernt (8) . 
Nach einem sich anschlieSenden Waschschritt kann ein neiier 
Zyklus beginnen. Zur Rekonstruktion einer grofieren ursprung- 
lichen DNA-Sequenz (z.B. mehrere Mb langes DNA- Stuck) sollen 
die DNA- Fragment e einige Hundert NT lang sein, falls man die 
Rekonstruktion nach dem Shotgun -Prinzip durchfiihrt ("Automated 
DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. 
Academic Press, Huang et al . Genom Res. 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J. Comput .Biol . 1994 v.l S.257). Da pro Zyklus 
nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 
300 Zyklen zur Sequenzierung notwendig. 



4 . 2 Auswahl des Materials 



Mit Hilfe der erf indungsgemaSen Methode ist es moglich, sowohl 
vorselektionierte DNA-Sequenzen (z.B. in YAC- , PAC-, oder BAC- 
Vektoren (R. Anand et al. NAR 1989 v. 17 S.3425, H. Shizuya et 
al. PNAS 1992 v.89 S.8794, "Construction of bacterial 
artificial chromosome libraries using the modified PAC system" 
in "Current Protocols in Human genetics" 1996 John Wiley & 
Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht 
vorselektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu 
analysieren. Durch eine Vorselektion ist es moglich, im 
Vorfeld relevante Inf ormationen, wie z.B. Sequenz -Abschnitte 
aus einem Genom oder Populationen an Genprodukten, aus der 
grofie Menge genetischer Informationen herauszuf iltern und 
damit die Menge der zu analysierenden Sequenzen 
einzuschranken. Besonders hervorzuheben sind die 
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Ausfuhrungsformen, bei denen die erf indungsgemSSen Verfahren 
ohne Vorselektionierung und ohne eine Vervielfaltigung des 
Materials eingesetzt werden. Verzicht auf PCR und Klonierung 
bringt eine entscheidende Beschleunigung in der hoch 
parallelen Analyse von Nukleinsauresequezen, was mit anderen 
Verfahren bis jetzt nicht moglich war. 



4.3 Vorbereitung des Materials 



Ziel der Materialvorbereitung ist es, gebundene einzel- 
strangige NSKFs mit einer Lange von vorzugsweise 50-1000 NTs, 
einer einzelnen Primerbindungsstelle und einem hybridisierten 
Primer (gebundene NSKF-Primer-Komplexe) zu erhalten. Diese 
NSKF- Primer- Komplexe haben beispielsweise die in Fig. 2 
dargestellte Struktur. Im einzelnen konnen sehr variable 
Konstruktionen aus dieser allgemeinen Struktur abgeleitet wer- 
den. Zur Verbesserung der Anschaulichkeit folgen nun einige 
Beispiele, wobei die angefuhrten Methoden einzeln oder in 
Kombination eingesetzt werden konnen. 



4.3.1 Erzeugung kurzer Nukleinsaurekettenf ragmente (50-1000 
NTs ) ( Fragment ierungsschr itt ) 

Wichtig ist, dass die Fragment ierung der NSKs so erfolgt, dass 
Fragmente erhalten werden, die uberlappende Teilsequenzen der 
Gesamtsequenzen darstellen. Dies wird durch Verfahren 
erreicht, bei denen unterschiedlich lange Fragmente als Spalt- 
produkte in zuf allsmaSiger Verteilung entstehen. 

ErfindungsgemaS kann die Erzeugung der Nukleinsaureketten- 
f ragmente (NSKFs) durch mehrere Methoden erfolgen, z.B. durch 
die Fragment ierung des Ausgangsmaterials mit Ultraschall oder 
durch Endonukleasen ("Molecular cloning". 1989 J.Sambrook et 
al. Cold Spring Harbor Laborotary Press), wie z.B. durch 
unspezif ische Endonukleasegemische . Erf indungsgemaS wird die 
Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen 
so einstellen, dass Fragmente mit einer durchschnitt lichen 
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Lange von 100 bp bis 1 kb entstehen. Diese Fragmente werden 
anschlieiSend an ihren Enden durch das Klenow- Fragment (E.coli- 
Polymerase I) oder durch die T4-DNA- Polymerase aufgefiillt 
("Molecular cloning" 1989 J.Sambrook et al. Cold Spring 
Harbor Laborotary Press) . 

Ausserdem konnen aus einer langen NSK unter Verwendung 
randomisierter Primer komplementare kurze NSKFs synthetisiert 
werden. Besonders bevorzugt wird diese Methode bei der Analyse 
der Gen-Sequenzen. Dabei werden an der mRNA einzelstrangige 
DNA-Fragmente mit randomisierten Primern und einer reversen 
Transkriptase gebildet (Zhang- J et al. Biochem.J. 1999 v. 337 
S.231, Ledbetter et al. J.Biol.Chem. 1994 v. 269 S. 31544, Rolls 
et al. Anal . Biochem . 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962). 

4.3.2 Einfiihrung einer Primerbindungsstelle in das NSKF. 

Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt , der 
eine selektive Bindung des Primers an das NSKF ermoglichen 
soil . 

In einer Ausfuhrungsform konnen die Primerbindungsstellen 
unterschiedlich sein, so dass mehrere unterschiedlche Primer 
verwendet werden miissen. In diesem Fall konnen bestimmte 
Sequenzabschnitte der Gesamtsequez als naturliche PBSs fur 
spezifische Primer dienen. Diese Ausfuhrungsform ist besonders 
fur die Untersuchung bereits bekannter SNP-Stellen geeignet, 
s. Beispiel 4 "SNP-Analyse mit sequenzspezif ischen Primern". 

In einer anderen Aus fuhnangs form ist es aus Grunden der 
Vereinfachung der Analyse gOnstig, wenn eine einheitliche 
Primerbindungsstelle in alien NSKFs vorhanden ist. GemaS einer 
bevorzugten Ausfuhrungsform der Erfindung werden die 
Primerbindungsstellen daher in die NSKFs extra eingefuhrt . Auf 
diese Weise konnen Primer mit einheitlicher Struktur fur die 
Reaktion eingesetzt werden. 
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Im folgenden wird diese Ausfuhrungeform detailliert 
beschrieben. 

Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
schrankt . Ihre Lange betragt vorzugsweise zwischen 20 und 50 
NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe 
zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe 
kann z.B. eine Biotingruppe sein. 

Als Beispiel fur die Einfuhrung einer einheitlichen 
Primerbindungsstelle werden im folgenden die Ligation und das 
Nukleotid-Tailing an DNA- Fragment e beschrieben. 

a) Ligation: 

Dabei wird ein doppelstrangiger Oligonukleotidkomplex rait 
einer Primerbindungsstelle verwendet (Fig. 3a) . Dieser wird 
mit kommerziell erhaltlichen Ligasen an die DNA-Fragmente 
ligiert ("Molecular cloning" 1989 J.Sambrook et al . Cold 
Spring Harbor Laborotary Press) . Es ist wichtig, dass nur eine 
einzige Primerbindungsstelle an das DNA- Fragment ligiert wird. 
Das erreicht man z.B. durch eine Modifikation einer Seite des 
Oligonukleotidkomplexes an beiden Strangen (Fig. 3b) . Die 
Resultate nach der Ligation bzw. nach anschliefiender 
Denaturierung sind in Fig. 3c und 3d dargestellt . Die 
modifizierenden Gruppen am Oligonukleotidkompex konnen zur 
Immobilisation dienen. Die Synthese und die Modifikation eines 
solchen Oligonukleotidkomplexes kann nach standardisierten 
Vorschriften durchgefuhrt werden. Zur Synthese kann z.B. der 
DNA-Synthesizer 380 A Applied Biosystems verwendet werden. 
Oligonucleotide mit einer bestimmten Zusammensetzung mit oder 
ohne Modifikationen sind aber auch als Auf tragssynthese 
kommerziell erhaltlich, z.B. von MWG-Biotech GmbH, Germany. 

b) Nukleotid-Tailing: 

Statt der Ligation mit einem Oligonukleotid kann man mit einer 
terminalen Deoxynucleotidyltransferase mehrere (z.B. zwischen 
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10 und 20) Nukleosid-monophosphate an das 3 1 -Ende eines ss- 
DNA-Fragments ankniipfen ("Molecular cloning" 1989 J.Sambrook 
et al. Cold Spring Harbor Laborotary Press, "Method in 
Enzymology" 1999 v. 303, S. 37-38) (Fig. 4), z.B. mehrere Guano- 
sin-Monophosphate ( (G) n-Tailing genannt) . Das entstehende 
Fragment wird zur Bindung des Primers, in diesem Beispiel 
eines (C) n-Primers, verwendet. 

4.3.3 Einzelstrang-Vorbereitung 

Fur die Sequenzierungsreaktion werden einzelstrangige NSKFs 
benotigt . Falls das Ausgangsmaterial in doppelstrangiger Form 
vorliegt, gibt es mehrere Moglichkeiten, aus doppelstrangiger 
DNA eine einzelstrangige Form zu erzeugen (z.B. Hitze- 
Denaturierung oder Alkali -Denaturierung) ("Molecular cloning" 
1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press) . 

4.3.4 Primer fur die Sequenzierungsreaktion 

Dieser hat die Funktion, den Start an einer einzigen Stelle 
des NSKF zu ermoglichen. Er bindet an die Primerbindungsstelle 
im NSKF. Die Zusammensetzung und die Lange des Primers sind 
nicht eingeschrankt . Aufier der Startf unktion kann der Primer 
auch andere Funktionen iibernehmen, wie z.B. eine Verbindung 
zur Reaktionsoberf lache zu schaffen. Primer sollten so an die 
Lange und Zusammensetzung der Primerbindungsstelle angepaSt 
werden, dass der Primer den Start der Sequenzierungsreaktion 
mit der jeweiligen Polymerase ermoglicht. 

Bei der Verwendung unterschiedlicher, beispielsweise naturlich 
in der ursprunglichen Gesamtsequenz vorkommender 
Primerbindungsstellen, werden die fiir die jeweilige 
Primerbindungsstelle sequenzspezif ischen Primer verwendet. In 
diesem Fall wird fur die Sequenzierung ein Primergemisch 
eingesetzt. 

Bei einer einheitlichen, beispielsweise durch die Ligation an 
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die NSKFs angekoppelten Primerbindungsstelle wird ein 
einheitlicher Primer verwendet. 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF 
dient, beispielsweise ist eine solche Funktionsgruppe eine 
Biotingruppe (s. Abschnitt Immobilisierung). Sie soil die 
Sequenzierung nicht storen. Die Synthese eines solchen Primers 
kann z.B. mit dem DNA- Synthesizer 380 A Applied Biosystems 
ausgefuhrt werden oder aber als Auf tragssynthese bei einem 
kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany 
erstellt werden) . 

Der Primer kann vor der Hybridisierung an die zu 
analysierenden NSKFs auf der Oberflache mit verschiedenen 
Techniken fixiert oder direkt auf der Oberflache 

synthetisiert werden, beispielsweise nach (McGall et al' US 
Patent 5412087, Barrett et al . US Patent 5482867, Mirzabekov 
et al. US Patent 5981734, "Microarray biochip technology" 2000 
M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena 
Oxford University Press, Fodor et al. Science 1991 v. 285 
S.767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 
S.3142, Ghosh et al. NAR 1987 v. 15 S.5353, Gingeras et al. NAR 
1987 v.15 S.5373, Maskos et al. NAR 1992 v. 20 S.1679). 

Die Primer werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 bis 100 pro 100 pm 2 , 100 bis 10.000 pro 100 
Mm 2 oder 10.000 bis 1.000.000 pro 100/im 2 gebunden. 

Der Primer oder das Primergemisch wird mit NSKFs unter 
Hybridisierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle des NSKF binden lassen. Diese Primer- 
Hybridisierung (Annealing) kann vor (1) , wahrend (2) oder nach 
(3) der Bindung der NSKFs an die Oberflache erfolgen. Die 
Optimierung der Hybridisierungsbedingungen hangt von der 
genauen Struktur der Primerbindungsstelle und des Primers ab 
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und lafit sich nach Rychlik et al. NAR 1990 v. 18 S.6409 
berechnen. Im folgenden werden diese Hybridisierungsbedingun- 
gen als standardisierte Hybridisierungsbedingungen bezeichnet. 

Falls eine fur alle NSKFs gemeinsame Primerbindungsstelle mit 
bekannter Struktur beispielsweise durch Ligation eigefiihrt 
wird, konnen Primer mit einheitlicher Struktur eingesetzt 
werden. Die Primerbindungsstelle kann an ihrem 3 1 -Ende eine 
funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. 
Beispielsweise ist diese Gruppe eine Biotin-Gruppe . Der Primer 
hat eine zur Primerbindungsstelle komplementare Struktur. 

Ein Beispiel einer Primerbindungstelle und eines Primers ist 
nachfolgend dargestellt. 

5 ' TAATACGACTCACTATAGG3 1 Primer (T7-19-Primer) 

Biotin-3 • ATTATGCTGAGTGATATCC5 ' Primerbindungsstelle 

4.3.5 Fixierung von NSKF- Primer -Komplexe an die Oberflache 
(Bindung bzw. Immobilisierung von NSKFs) . 

Ziel der Fixierung (Immobilisierung) ist es, NSKF-Primer- 
Komplexe auf einer geeigneten planen Oberflache in einer Art 
und Weise zu fixieren, dass eine zyklische enzymatische 
Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise 
durch Bindung des Primers (s.o.) oder des NSKF an die 
Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Fixierung von NSKF- 
Primer -Komplexen kann variabel sein: 

1) Die NSKF-Primer-Komplexe konnen zunachst in einer Losung 
durch Hybridisierung (Annealing) gebildet und 
anschliefiend an die Oberflache gebunden werden. 

2) Primer konnen zunachst auf einer Oberflache gebunden 
werden und NSKFs anschlieSend an die gebundenen Primer 
hybridisiert werden, wobei NSKF-Primer-Komplexe 
entstehen (NSKFs indirekt an die Oberflache gebunden) 
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3) Die NSKFs konnen zunachst an die Oberflache gebunden 
werden (NSKFs direkt an die Oberflache gebunden) und im 
anschliefienden Schritt die Primer an die gebundenen 
NSKFs hybridisiert werden, wobei NSKF-Primer-Komplexe 
enstehen. 

Die Immobilisierung der NSKFs an die Oberflache kann daher 
durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf lache sind vorliegend als 
gleichwertige Begriffe aufzufassen, auSer wenn explizit auf 
eine andere Bedeutung hingewiesen wird. Als 

Reaktionsoberf lache dient die Oberflache einer festen Phase 
eines beliebigen Materials . Dieses Material ist vorzugsweise 
enzymatischen Reaktionen gegenuber inert und verursacht keine 
Storungen der Detektion. Silicon, Glas, Keramik, Kunststoff 

(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
oder Alluminium) oder beliebiges anderes Material, das diesen 
funktionellen Anf orderungen geniigt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 

Falls eine gelartige feste Phase (Oberflache eines Gels) 
verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekule 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% 
Poly aery 1 amid Gel verwendet werden) . Eine solche Geloberf lache 
hat anderen festen Oberflachen gegenuber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt. Durch die Bindung der NSKF-Primer- 
Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale 
von freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt 
(Fig. 5a) . Diese feste Unterlage kann Silicon, Glas, Keramik, 
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Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall 
(Gold, Silber, oder Alluminium) oder beliebiges anderes 
Material sein. 

Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 mm. 
Die Geldicke ist vorzugsweise groSer als die einfache 
Tiefenscharfe des Objektivs sein, damit unspezif isch an die 
feste Unterlage gebundene NTs* nicht in die Fokusebene 
gelangen und damit detektiert werden. Wenn die Tiefenscharfe 
z.B. 0,3 \im betragt, so liegt die Geldicke vorzugsweise 
zwischen 1 jam und 100 \im. Die Oberflache kann als e'ine 
kontinuierliche Oberflache oder als diskontinuierliche, aus 
einzelnen kleinen Bestandteilen (z.B. Agarose -Kiigelchen) 
zusammengesetzte Oberflache hergestellt werden (Fig. 5b). Die 
Reaktionsoberflache muE groS genug sein, urn die notwendige 
Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu 
konnen. Die Reaktionsoberflache sollte vorzugsweise nicht 
grofier als 20 cm 2 sein. 

Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionslosungen uber der Oberflache. Die 
Reaktionsoberflache ist vorzugsweise Bestandteil eines 
Reaktionsgef a£es . Das Reaktionsgef a£ ist wiederum vorzugsweise 
Bestandteil einer Reaktionsapparatur mit Durchf lufivorrichtung. 
Die Durchf luSvorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgef aS. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung oder manuell 
erfolgen. Wichtig dabei ist, dass die Oberflache nicht 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgef afies weniger als 50 \xl. Idealerweise betragt sein 
Volumen weniger als l jil. Ein Beispiel eines solchen 
Duchflufisystems ist in Fig. 6 gegeben. 

Falls die Fixierung der NSKF- Primer- Komplexe auf der 
Oberflache uber die NSKFs erfolgt, kann dies beispielsweise 
durch die Bindung der NSKFs an einem der beiden Ketten-Enden 
erfolgen. Dies kann durch entsprechende kovalente, affine oder 
andere Bindungen erreicht werden. Es sind viele Beispiele der 
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Immobilisierung von Nukleinsauren bekannt (McGall et al. US 
Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et 
al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton 
Publishing, "DNA Microarrays" 1999 M. Schena Oxford University 
Press, Rasmussen et al. Analytical Biochemistry v. 198, S.138, 
Allemand et al. Biophysical Journal 1997, v. 73, S.2064, 
Trabesinger et al. Analytical Chemistry 1999, v. 71, S.279, 
Osborne et al. Analytical Chemistry 2000, v. 72, S.3678, 
Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S.3142, 
Ghosh et al. NAR 1987 v. 15 S.5353, Gingeras et al. NAR 1987 
v.15 S.5373, Maskos et al. NAR 1992 v. 20 S.1679). Die 
Fixierung kann auch durch eine unspezif ische Bindung, wie 
z.B. durch Austrocknung der NSKFs enthaltenden Probe auf der 
planen Oberflache erreicht werden. 

Die NSKFs werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 und 100 NSKFs pro 100 ym 2 , 100 bis 10.000 
pro 100 /xm 2 , 10.000 bis 1.000.000 pro 100/xm 2 gebunden. 

Die fur die Detektion notwendige Dichte von extensionsf ahigen 
NSKF- Primer- Komplexen betragt ca. 10 bis 100 pro 100 jan 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer an 
die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
von NSKF - Primer - Komplexen naher dargestellt: In einer Aus- 
fuhrungsform erfolgt die Immobilisierung der NSKFs liber 
Biotin-Avidin oder Biotin-Streptavidin-Bindung. Dabei wird 
Avidin oder Streptavidin auf der Oberflache kovalent gebunden, 
das 5'-Ende des Primers enthalt Biotin. Nach der 
Hybridisierung der markierten Primer mit den NSKFs (in Losung) 
werden diese auf der mit Avidin/Streptavidin beschichteten 
Oberflache fixiert. Die Konzentration der mit Biotin 
markierten Hybridisierungs-Produkte sowie die Zeit der 
Inkubation dieser Losung mit der Oberflache wird so gewahlt, 
dass eine fur die Sequenzierung geeignete Dichte bereits in 
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diesem Schritt erreicht wird. 

In einer anderen bevorzugten Ausfuhrungsf orm werden die fur 
die Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstrangigen NSKFs mit 
jeweils einer Primerbindungsstelle pro NSKF werden damit unter 
Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden 
sie an die fixiert en Primer und werden dadurch gebunden 
(indirekte Bindung) , wobei Primer-NSKF-Komplexe entstehen. Die 
Konzentration der einzelstrangigen NSKFs und die 
Hybridisierungsbedingungen werden so gewahlt, dass man. eine 
fur die Sequenzierung geeignete Immobilisationsdichte von 10 
bis 100 ext ens ions fahigen NSKF-Primer-Komplexen pro 100 \im 2 
erreicht. Nach der Hybridisierung werden ungebundene NSKFs 
durch einen Waschschritt entfernt. Bei dieser Ausfuhrungsf orm 
wird eine Oberflache mit einer hohen Primerdichte bevorzugt, 
z.B. ca. 1.000.000 Primer pro lOO^m 2 oder noch hoher, da die 
gewunschte Dichte an NSKF-Primer-Komplexen schneller erreicht 
wird, wobei die NSKFs nur an einen Teil der Primer binden. 

In einer anderen Ausfuhrungsf orm werden die NSKFs an die 
Oberflache direkt gebunden (s.o.) und anschlieSend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 NSKFs pro 100/xm 2 wird man versuchen alle 
verfiigbaren NSKFs mit einem Primer zu versehen und fur die 
Sequenzierugnsreaktion verfugbar zu machen. Dies kann z.B. 
durch hohe Primerkonzentration, beispielsweise 1 bis 100 
mmol/1, erreicht werden. Bei einer hoheren Dichte der 
fixierten NSKFs auf der Oberflache, beispielsweise 10.000 bis 
1.000.000 pro lOO/im 2 , kann die fur die optische Detektion 
notwendige Dichte der NSKF-Primer-Komplexe wihrend der 
Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
Primerkonzentration) so zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten NSKFs binden. 
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Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise 
eine Blockierungsldsung auf die Oberflache vor dem Schritt (a) 
in jedem Zyklus gebracht, die zur Vermeidung einer unspezifi- 
schen Adsorbtion von NTs* an der Oberflache dient. Diese 
Bedingungen fur eine Blockierlosung erfullt beispielsweise 
eine Albuminlosung (BSA) mit einem pH-Wert zwischen 8 und 10. 



4.4 Wahl der Polymerase 



Als Polymerasen eignen sich prinzipiell alle DNA-abhangigen 
DNA- Polymerasen ohne 3' -5' Exonuklease-Aktivitat (DNA- 
Replication" 1992 Ed. A. Romberg, Freeman and company NY), 
z.B. modifizierte T7- Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech), 3' -5' exonuklease freies Klenow 
Fragment der DNA- Polymerase I (Amersham Pharmacia Biotech) , 
Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA 
Polymerases" 1983, Fry M., CRC Press Inc., kommerziell 
erhaltlich bei Chimerx) thermostabile Polymerasen wie 
beispielsweise Taq- Polymerase (GibcoBRL) , proHATM Polymerase 
(Eurogentech) . 



Polymerasen mit 3 '-5' Exonuklease-Aktivitat konnen eingesetzt 
werden (z.B. Klenow- Fragment der E. col i- Polymerase I), sofern 
Reaktionsbedingungen gewahlt werden, die vorhandene 3 '-5' 
Exonuklease-Aktivitat unterdrucken, wie z.B. ein niedriger pH- 
Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. 
Biol. Chem. 1964 v. 239 S.233) oder Zugabe von NaF zur 
Einbaureaktion. Eine andere Moglichkeit besteht in der 
Verwendung von NTs* mit einer Phosphorothioate-Verbindung 
(Kunkel et al. PNAS 1981, v. 78 S.6734). Dabei werden 
eingebaute NTs* von der 3' -5* Exonuklease-Aktivitat der 
Polymerase nicht angegriffen. Im folgenden werden all diese 
Polymerasearten als "Polymerase" bezeichnet. 
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4.5 Chemie 

4.5.1 Allgemeine NT-Struktur 

In den erf indungsgemafien Verfahren konnen unterschiedliche 
NT*s verwendet werden (vorzugsweise 2 1 -deoxy-Nukleotid- 
Triphosphate) , die an ihrer 3 1 -Position des Riboseringes 
einen Substituenten tragen. Dieser Substituent kann alleine 
oder zusammen mit dem Fluoreszenzf arbstof f zur Termiantion 
der Einbaureaktion fuhren und kann unter milden Bedingngen 
vom Nukleotid abgespalten werden. An diesen Substituenten 1st 
ein fur das jeweilige NT* charakteristischer 
Fluoreszenzf arbstof f angekoppelt, so dass der Substituent 
auch die Rolle eines Linkers zwischen dem Nukleotid und dem 
Fluoreszenzf arbstof f ubernimmt. Der Fluoreszenzf arbstof f wird 
vorzugsweise an diesen Linker durch eine unter milden 
Bedingungen spaltbare Bindung angekoppelt . 

Unter ^milden Bedingungen"" werden Spaltungsbedingungen 
verstanden, die weder zur Denaturierung des Primer- 
Nukleinsaure-Komplexes fuhren, noch zur Spaltung seiner 
einzelner Bestandteile . 

Formeln (1-3) stellen Beispiele fur die reversiblen 
spaltbaren Terminatoren dar: 

1) NT-3'-0-S(l)-F 

2) NT-3'-0-S(2)-N-F 

3) NT- 3 ' -0-S (2) -N-L-F 

NT-3 • -O - stellt den 2 1 -Deoxy-Nukleosid-Triphosphat-Rest 
dar. 

S(D - stellt einen Substituenten (Formel l) dar, der 

unter milden Bidingungen vom NT* abgespalten werden kann. An 
diesen Substituenten ist ein Fluoreszenzf arbstof f (F) 
gekoppelt . 

S(2)-N - stellt einen weiteren Substituenten (Formel 2 und 
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3) dar, der unter milden Bidingungen vom NT* abgespalten 
werden kann. Dieser Substituent ist mit dem 
Fluoreszenzfarbstoff (F) durch eine unter milden Bedingungen 
spaltbare Gruppe (N) verbunden. Der Fluoreszenzfarbstoff kann 
unmittelbar an die spaltbare Gruppe (Formel 2) oder durch 
einem weiteren Linker (L) (Formel 3) gekoppelt sein. 



Beispiele fur NT*-Strukturen, NT*-Synthese , zur Polymerase- 
Wahl fur die Einbaureakiton , Reaktionsbedingungen der NT*- 
Einbaureakion und Abspaltungsreaktion sind in (Kwiatkoxski 
WO-Patent 01/25247, Kwiatkowski US-Patent 6.255.475, Conard 
et al. US-Patent 6.001.566, Dower (US Patent 5.547.839), 
Canard et al. (US Patent 5.798.210), Rasolon j atovo 
(Nucleosides & Nucleotides 1999, v. 18 S.1021), Metzker et al . 
(NAR 1994, v.22, S.4259), Welch et al . (Nucleosides & 
Nucleotides 1999, v. 18, S.197) beschrieben. 

4.5.2 Marker, Fluorophore 

Jedes Nukleotid ist mit einem charakteristischen Marker (F) 
markiert. Der Marker ist ein f luoreszierender Farbstoff. 
Die Wahl ist nicht eingeschrankt , sofern der Farbstoff 
folgenden Anf orderungen genugt: 

a) Die verwendete Detektionsapparatur muS diesen Marker als 
einziges Molekul gebunden an DNA unter milden Bedingungen 
(vorzugsweise Reaktionsbedingungen) identif izieren konnen. 
Die Farbstoff e haben vorzugsweise grofie Photostabilitat . Ihre 
Fluoreszenz wird vorzugsweise von der DNA nicht oder nur 
unwesentlich gequencht . 

b) Der an das NT gebundene Farbstoff darf keine irreversible 
Storung der enzymatischen Reaktion verursachen. 

c) mit dem Farbstoff markierte NTs* mussen von der Polymerase 
in die Nukleinsaurekette eingebaut werden. 
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d) Bei einer Markierung mit verschiedenen Farbstoffen sollen 
diese Farbstoffe keine betrachtlichen Uberlappungen in ihren 
Emissionsspektren aufweisen. 

Beispielsweise sind einige Fluorophore, die im Rahmen der 
vorliegenden Erfindung verwendbar sind, in "Handbook of 
Fluorescent Probes und Research Chemicals" 6th ed. 1996, 
R.Haugland, Molecular Probes mit Strukturf ormeln 
zusammengestellt . Erf indungsgemaS werden vorzugsweise 
folgende Farbstof f klassen als Marker eingesetzt: Cyanln- 
Farbstoffe und deren Abkommlinge (z.B. Cy2, Cy3, Cy5, Cy7 
Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), 
Rhodamine und deren Abkommlinge (z.B. TAMRA, TRITC, RG6, 
R110, ROX, Molecular Probes, s. Handbuch) , Xanthene-Derivate 
(z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al . US- 
Patent 6.130.101) und Porphyrine (Porphyrin -Systems, 
Deutschland) . Diese Farbstoffe sind kommerziell erhaltlich. 

Dabei kann man je nach spektralen Eigenschaf ten und 
vorhandener Apparatur entsprechende Farbstoffe auswahlen. Die 
Farbstoffe werden an das NT* uber einen spaltbaren Linker 
gebunden. Die Farbstoffe konnen an den Linker z.B. uber 
Thiocyanat- oder Ester-Bindung gekoppelt werden ("Handbook of 
Fluorescent Probes und Research Chemicals" 6th ed. 1996, 
R.Haugland, Molecular Probes, Jameson et al. Methods in 
Enzymology 1997 v. 278 S.363, Waggoner Methods in Enzymology 
1995 v.246 S.362) 



4.5.3 Spaltbare Bindung zwischen dem Nukleotid und dem 
Substituenten, Spaltung . 

Der zur Termination fiihrende Substituent ist an das NT durch 
eine unter milden Bedingungen spaltbare Bindung gekoppelt. 
Beispiele fur diese Verbindungen stellen Ester und Acetale 
dar. 

Die Spaltung der Ester erfolgt vorzugsweise im basischen pH- 
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Bereich (z.B. 9 bis 11). Die Spaltung von Acetalen erfolgt im 
saueren Bereich (z.B. zwischen 3 und 4). 

Ester konnen auch enzymatisch durch Polymerasen Oder Esterasen 
abgespalten werden. 

In einer bevorzugten Ausfiihrungsform der Erfindung wird der 
Substituent zusammen mit dem Fluoreszenzf arbstof f in einem 
Schritt abgespalten. 

4.5.4 Spaltbare Bindung zwischen dem Substituenten und dem 
Fluoreszenzf arbstof f , Spaltung . 

In einer anderen bevorzugten Ausfiihrungsform der Erfindung ist 
der Fluoreszenzfarbstoff an den Substituenten durch eine unter 
milden Bedingungen spaltbare Gruppe gekoppelt . 

* 

Vorzugsweise gehort die genannte Gruppe zu chemisch oder 
enzymatisch spaltbaren oder photolabilen Verbindungen. 
Ester-, Thioester- , Disulf id-Verbindungen und photolabile 
Verbindungen eignen sich besonders gut als spaltbare 
Verbindung zwischen dem Substituenten und dem 
Fluoreszenzfarbstoff . 

Als Beispiele von chemisch spaltbaren Gruppen sind Ester-, 
Thioester- und Disulf id-Verbindungen bevorzugt (^Chemistry of 
protein conjugation and cross linking"" Shan S. Wong 1993 CRC 
Press Inc., Herman et al. Method in Enzymology 1990 v. 184 
S.584, Lomant et al . J.Mol.Biol. 1976 v. 104 243, "Chemistry of 
carboxylic acid and esters" S.Patai 1969 Interscience Publ.). 
Beispiele fur photolabile Verbindungen konnen in folgenden 
Literaturstellen gefunden werden: "Protective groups in 
organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai 
Synthesis 1980 S.l, V. Pillai Org. Photochem. 1987 v. 9 S.225, 
Dissertation $Neue photolabile Schutzgruppen fur die 
lichtgesteuerte Oligonucleotidsynthese^ H. Giegrich, 1996, 
Konstanz, Dissertation $Neue photolabile Schutzgruppen fur die 
lichtgesteuerte Oligonucleotidsynthese^ S.M.Buhler, 1999, 
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Konstanz) . 

Der Spaltungsschritt ist in jedem Zyklus vorhanden und muE 
unter milden Bedingungen verlaufen, so dass die Nukleinsauren 
nicht beschadigt oder modifiziert werden. 

Die Spaltung l&uft bevorzugt chemisch (z.B. in milder saurer 
oder basischer Umgebung fur eine Ester-Verbindung oder durch 
Zugabe eines Reduktionsmittels, z.B. Dithiothreitol oder 
Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbindung) , oder physikalisch (z.B. durch Beleuchtung der 
Oberflache mit Licht einer bestimmten Wellenlange fur die 
Spaltung einer photolabilen Gruppe, Dissertation $Neue 
photolabile Schutzgruppen fur die lichtgesteuerte 
Oligonucleotidsynthese^ H. Giegrich, 1996, Konstanz) ab. 

In dieser Ausfuhrungsf orm wird nach der Detektion zunachst 
der Fluoreszenzfarbstof f abgespalten und erst dann der an die 
3' -Position gekoppelte, zur Termination fuhrende Substituent. 

4.5.5 Farbiges Kodierungsschema, Anzahl der Farbstoffe 
Jedes NT* muS eindeutig mit einem charakteristischen 
Farbstoff markiert sein. Vorzugsweise kann man einen Zyklus 
durchf iihren mit : 

a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei verschieden markierten NT*s und zwei unmarkierten 
NTs, 

(auch andere Kombinationen sollten einem Fachmann naheliegend 

erscheinen) 

d.h. 

a) Man kann alle 4 NTs mit verschiedenen Farbstoffen 
markieren und alle 4 gleichzeitig in die Reaktion einsetzten. 
Dabei erreicht man die Sequenzierung einer Nukleinsaurekette 
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mit einer minimalen Anzahl von Zyklen. Diese Variant e der 
Erfindung stellt allerdings hohe Anforderungen an das 
Detektionssystem: 4 verschiedene Farbstoffe miissen in jedem 
Zyklus identifiziert werden, 

b) Zur Vereinfachung der Detektion kann eine Markierung mit 
zwei Farbstoffen gewahlt werden. Dabei werden 2 Paare von 
NTs* gebildet, die jeweils verschieden markiert sind, z.B. A 
und G tragen die Markierung "X", C und U tragen die 
Markierung «Y». In die Reaktion in einem Zyklus (n) werden 2 
unterschiedlich markierte NTs* gleichzeitig eingesetzt, z.B. 
C* in Kombination mit A* , und im darauf f olgenden Zyklus (n+1) 
werden dann U* und G* zugegeben. 

c) Man kann auch nur einen einzigen Farbstoff zur Markierung 
aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen. 

d) In einer technisch vereinf achten Ausfuhrungsf orm werden 
pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und 
zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . Diese 
Ausfuhrungsform kann verwendet werden, urn Varianten (z.B. 
Mutationen, oder alternativ gespleiSte Gene) einer bereits 
bekannten Sequenz zu ermitteln. 

Unter Reaktionsbedingungen erfolgt der Einbau von NT*s in die 
NSKFs vorzugsweise so, daS an mehr als 50% der an der 
Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein 
markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. 
Das hangt damit zusammen, dafi an manchen Nukleinsaureketten 
die Reaktion sehr langsam ablauft. Ein Einbau der NTs* an 
jeder komplementaren Position in jedem Zyklus wird 
angestrebt, ist aber nicht erforderlich, weil nur die 
erfolgreichen Einbaureaktionen detektiert und ausgewertet 
werden; eine verzogerte Reaktion im Nachf olgenden Zyklus 
fuhrt nicht zu einem Sequenzierungsfehler . 

Vorzugsweise wird fur alle NTs* dieselbe Polymerase 
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verwendet. Es konnen aber auch verschiedene Polymerasen fur 
verschiedene NTs* eingesetzt werden. 

4.6 Detektionsapparatur 

Einzelne Molekiile auf einer Oberflache kann man mit 
verschiedenen Methoden untersuchen. Es sind mehrere Verfahren 
bekannt : z . B . AtomForce-Mikroscopie , Elektronen-Mikroskopie , 
Nahfeld-Fluoreszenz-Mikroscopie, Weitf eld-Fluoreszenz- 

Mikroskopie, TIR-Mikroskopie usw. (Science 1999 v. 283 1667, 
Unger et al. BioTechniques 1999 v. 27 S.1008, Ishijaima et al . 
Cell 1998 v.92 S.161, Dickson et al. Science 1996 v. 274 S.966, 
Xie et al. Science 1994 v. 265 S.361, Nie et al. Science 1994 
v.266 S.1018, Betzig et al . Science 1993 v. 262 S.1422). 

firf indungsgemafi werden Fluoreszenz-Signale einzelner in die 
Nukleinsaurekette eingebauter NTs* vorzugsweise mit einem 
Weitf eld-Fluoreszenz-Mikroskop (Epif luoreszenz) oder einem 
Laser- Scanning-Mikroskop (Epif luoreszenz) oder einem TIRF- 
Microskop (Total Internal Reflection Fluorescence Microscope) . 

Es sind verschiedene Varianten der Konstruktion einer solchen 
Apparatur moglich (Weston et al. J.Chem.Phys. 1998 v. 109 
S.7474, Trabesinger et al . Anal. Chem. 1999 v. 71 S.279, Adachi 
et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. 
BioTechniques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 
v.92 S.161, Dickson et al. Science 1996 v. 274 S.966, Tokunaga 
et al. Bichem.Biophys.Res.Com. 1997 v. 235 S.47, "Confocal 
Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press ). Unterschiede in ihrem konkreten 
Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die 
Vorrichtung fur das Anregungslicht kann z.B. auf der Basis 
eines Lasers, einer Lampe oder von Dioden funktionieren. Fur 
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die Detektionsvorrichtung kdnnen sowohl CCD-Kameras als auch 
PMT dienen. Andere Beispiele fur technische Details siehe 
("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS 
Scientific Publishers, "New Techniques of optical microscopy 
and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press). Es ist nicht die Aufgabe dieser 
Erfindung, alle moglichen technischen Varianten einer 
Detektionsvorrichtung aufzuzahlen. Der prinzipielle Aufbau 
einer geeigneten Apparatur wird in einem Schema Fig. 8 
erlautert. Sie besteht aus folgenden Elementen: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Lichtleitender Teil (2) 
Scant isch (3) 

Vorrichtung zur Selektion von Spektren (4) 
Detektionsvorrichtung (5) 

Computer mit Steuerungs- und Analysef unktionen (6) 

Diese Elemente der Apparatur konnen kommerziell erworben 
werden (Mikroskop-Firmen: Zeiss, Leica, Nikon. Olympus) . 

Im folgenden soil beispielsweise eine fur die Detektion 
einzelner Molekule geeignete Kombination aus diesen Elementen 
vorgestellt werden: 

Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit 
Quecksilberdampf lampe 

Objektiv Planneofluar lOOx, NA 1.4 (Zeiss) 
Kamera Photometrix oder AxioCam (Zeiss) 
Computer mit Software zur Steuerung und Analyse 

Nachfolgend soil die Vorgehensweise bei der Detektion 
erlautert werden. Man beachte dabei die allgemeinen Regeln der 
Fluoreszezmikroskopie ("Confocal Laser Scanning Microscopy" 
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1997 Ed. Sheppard, BIOS' Scientific Publishers, "New Techniques 
of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry 
CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed, Herman 
BIOS Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press). 

Die Detektion umfaSt folgende Phasen: 

1) Vorbereitung zur Detektion 

2) Durchfiihrung eines Detektionsschrittes in jedem Zyklus, 
wobei jeder Detektionsschritt als Scanvorgang ablauft und 
folgende Operationen umfafit: 

a) Einstellung der Position des Objektivs (X,Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekiile, Zuordnung 
des Signals zu NT* und Zuordnung des Signals zum 
jeweiligen NSKF, 

d) Verschiebung zur nachsten Position auf der 
Oberflache. 

Die Signale von in die NSKFs eingebauten NTs* werden durch das 
Abscannen der Oberflache registriert. Der Scanvorgang kann in 
verschiedener Weise ausgefuhrt werden ("Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press). Beispielsweise wird ein 
diskontinuierlicher Scanvorgang gewahlt . Dabei wird das 
Objektiv schrittweise iiber die Oberflache bewegt (Fig. 8a), so 
dass von jeder Oberf lachenposition ein zweidimensionales Bild 
(2D-Bild) entsteht (Fig 8b, c). 

Dieses 2D-Bild kann mit verschiedenen Methoden erstellt 
werden: z.B. durch den Laser-Scan einer Position des 
Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine 
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Kameraaufnahme an einer Position . (vgl. Handbiicher der 
Mikroskopie) . Als Beispiel wird die Detektion einzelner 
Molekiile mit einer CCD-Kamera beschrieben. 

Die Detektion wird schematisch am Beispiel der Sequenzierung 
eines 1Mb langen DNA-Stiicks erlautert : 

1) Vorbereitung zur Detektion: 

Am Anfang wird festgelegt, wie viele NSKF-Sequenzen zur 
Rekonstruktion der ursprunglichen Sequenz analysiert werden 
mtissen. Im Fall einer Rekonstruktion nach dem SchrotschuE- 
Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 
1994 M. Adams et al . Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v. 23 S.4992, Miller et al. J. Comput . Biol . 1994 v.l 
S.257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF 
wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs 
bestimmt. 2) Die Gesamtlange der zu analysierenden Sequenz ist 
wichtig. 3) Bei der Sequenzierung mufi ein bestimmtes Mafi an 
Redundanz erreicht werden, urn die Genauigkeit zu steigern und 
eventuelle Fehler zu korrigieren. Insgesamt ist zur 
Rekonstruktion des grofiten Teils der ursprunglichen Sequenz 
die etwa 10- bis 100-fache Menge an Rohsequenzen erf orderlich, 
d.h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb 
Rohsequenzdaten gebraucht . Bei einer durchschnittlichen 
Sequenzlange von 400 bp pro NSKF benotigt man entsprechend 
25.000 bis 250.000 DNA-Fragmente . 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus 

Zur Sequenzierung miissen die Positionen der NSKFs bestimmt 
werden, damit man eine Grundlage fur die Zuordnung der Signale 
hat. Die Kenntnis dieser Positionen erlaubt eine Aussage 
dariiber, ob die Signale einzelner Molekiile von eingebauten 
NTs* stammen oder von zufallig an die Oberflache gebundenen 
NTs*. Diese Positionen konnen mit verschiedenen Methoden 
identif iziert werden. 
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In einer bevorzugten ' Ausfiihrungsf orm werden die Posit ionen 
gebundener NSKF- Primer- Komplexe wahrend der Sequenzierung 
identif iziert . Dabei wird die Tatsache genutzt, dass die 
Signale von den in die Nukleinsaurekette eingebauten NTs* 
immer dieselben Koordinaten haben. Das ist durch die Fixierung 
der Nukleinsaureketten gewahrleistet . Die unspezifisch 
gebundenen NTs* binden zufallig an verschieden Stellen der 
Oberf lache . 

Zur Identif izierung der Positionen von fixierten NSKFs werden 
die Signale auf Ubereinstimmung ihrer Koordinaten aus mehreren 
aufeinander folgenden Zyklen uberpriift. Das kann z.B. am 
Anfang der Sequenzierung erfolgen. Die ubereinstimmende 
Koordinaten werden als Koordinaten der DNA- Fragment e bewertet 
und gespeichert. 

Das Scan-System muS reproduzierbar uber mehrere Zyklen die 
Oberf lache abscannen konnen. X,Y und Z-Achsen-Einstellungen an 
jeder Oberf lachenposition konnen von einem Computer 
kontrolliert werden. Stabilitat und Reproduzierbarkeit der 
Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden liber die Qualitat der Detektion und somit uber die 
Identif izierung der Signale einzelner Molekule. 

a) Einstellung der Position des Objektivs (X,Y-Achse) 

Die mechanische Instabilitat der kommerziell erhaltlichen 
Scantische und die geringe Reproduzierbarkeit der wiederholten 
Einstellung derselben X, Y-Positionen machen eine prazise 
Analysen der Signale einzelner Molekule uber mehrere Zyklen 
schwierig. Es existieren viele Moglichkeiten, eine 
Ubereinstimmung der Koordinaten bei wiederholten Einstellungen 
zu verbessern bzw. mogliche Abweichungen zu kontrollieren. Als 
Beispiel wird eine Kontrollmoglichkeit angefuhrt. Nach einer 
groben mechanischen Einstellung der Objektivposition wird ein 
Kontrollbild von einem mit der Oberflciche fest verbundenen 
Muster gemacht. Auch wenn die mechanische Einstellung nicht 
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exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 
ym sind durchaus moglich) , kann man mittels optischer 
Kontrolle eine Korrektur vornehmen . Das Kontrollbild vom 
Muster dient als Koordinatensystem fur das Bild mit Signalen 
von eingebauten NTs* . Eine Voraussetzung fur eine solche 
Korrektur ist, dass keine weiteren Bewegungen der Oberflache 
zwischen diesen beiden Aufnahmen gemacht werden. Signale von 
einzelnen Molekiilen werden in Relation zum Muster gesetzt, so 
dass eine X, Y-Abweichung in der Musterposition gleiche X,Y- 
Abweichung in der Position der Signale einzelner Molekule 
bedeutet. Das Kontrollbild vom Muster kann vor, wahrend oder 
nach der Detektion einzelner Molekiile gemacht werden. Ein 
solches Kontrollbild muE entsprechend bei jeder Einstellung 
auf einer neuen Oberf lachenposition .gemacht werden. 

b) Einstellung der Fokusebene (Z-Achse) 

Die Oberflache ist nicht absolut plan und weist verschiedene 
Unebenheiten auf. Dadurch verandert sich der Oberf lache -Ob jek- 
tiv-Abstand beim abscannen benachbarter Stellen. Diese Unter- 
schiede im Abstand konnen dazu fiihren, dass einzelne Molekule 
die Fokusebene verlassen und so der Detektion entgehen. 

Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- 
flache eine reproduzierbare Einstellung der Fokusebene an 
jeder Objektivposition erreicht wird. 

Es gibt verschiedene Moglichkeiten, die Fokusebene 
reproduzierbar einzustellen. Beispielsweise kann folgende 
Methode angewendet werden: Da die Anregung einzelner Molekule 
zum Ausloschen ihrer Fluoreszenz fuhren kann, wird auf die 
Oberflache ein Marker aufgebracht, der zur Einstellung der 
Fokusebene dient. Danach erfolgt die Detektion der Signale 
einzelner Molekule. Der Marker kann beliebiger Natur sein 
(z.B. Farbstoff oder Muster), darf aber die Detektion und die 
Reaktion nicht beeintrachtigen. 
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c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zutn jeweiligen NSKF. 

Das mit Hilfe des Detektionssystems erzeugte zweidimensionale 
Bild der Reaktionsoberf lache enthalt die Signalinformationen 
von in die NSKFs eingebauten NT's. Diese nuissen vor der 
weiteren Verarbeitung aus der Gesamtdatenmenge der 
Bildinformationen mit geeigneten Methoden extrahiert werden. 
Die dazu notwendigen Algorithmen zur Skalierung, 
Transformation und Filterung der Bildinformationen zahlen zum 
Standardrepertoir der digitalen Bildverarbeitung und 
Mustererkennung (Haberacker P. "Praxis der Digitalen 
Bildverarbeitung und Mustererkennung" . Hanser-Verlag, Munchen, 
Wien, 1995; Galbiati L.J. "Machine vision and digital image 
processing fundamentals". Prentice Hall, Englewood Cliffs, New 
Jersey, 1990) . Die Signalextraktion erfolgt vorzugsweise uber 
ein Grauwertbild, das die Helligkeitsverteilung der Reaktions- 
oberf lache fur den jeweiligen Fluoreszenzkanal abbildet. Wenn 
bei der Sequenzierungsreaktion mehrere Nukleotide mit 
unterschiedlichen Fluoreszenz-Farbstof f en verwendet werden, 
kann zunachst fur jedes verwendete f luoreszenzmarkierte 
Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild erzeugt 
werden. Dafiir konnen prinzipiell 2 Verfahren angewendet 
werden : 

1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersatze) 
wird fur jeden Fluoreszenzkanal ein Grauwertbild erzeugt. 

2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit 
Hilfe eines geeigneten Algorithmus durch ein 
Bildverarbeitungsprogramm die relevanten Farbkanale extrahiert 
und jeweils als Grauwertbild einzeln weiterverarbeitet . Zur 
Kanalextraktion wird dabei ein fur den jeweiligen Kanal 
spezifischer Farb-Schwellwertalgorithmus eingesetzt. So 
entstehen zunachst aus einem Mehrkanal-Farbbild einzelne 
Grauwertbilder 1 bis N. Diese Bilder definieren sich wie 
f olgt : 
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GB N = (s(x,y)) 
N={l, . • . , Anzahl 
M«{0,1, . . . ,255} 
S=(s (x,y) ) 
x=0 , 1, . . . ,L-1 
y=0, 1, . . . ,R-1 
(x,y) 

s (x,y) € M 



der Fluoreszenzkanale} . 
Grauwertmenge 

Bildmatrix des Grauwertbildes 

Bildzeilen 

Bildspalten 

Ortskoordinaten eines Bildpunktes 
Grauwert des Bildpunktes. 



einkanaliges Grauwertbild 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm 
die relevante Bildinf ormation extrahiert . Ein solches Programm 
sollte folgende Arbeitsschritte realisieren: 

Fur GB,^ bis GB N durchfuhren: 

I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenf alls 
Reduktion des durch die Digitalisierung der Bildinf ormation 
entstandenen Bildrauschens, etwa durch Grauwertglattung. 

II. Prufung jedes Bildpunkt (x,y) des Grauwertbildes, ob 
dieser Punkt im Zusammenhang mit den ihn umgebenden 
unmittelbaren und weiter entfernten Nachbarbildpunkten die 
Eigenschaf ten eines Fluoreszenzpunktes erf ullt . Diese 
Eigenschaf ten hangen unter anderem von der verwendeten 
Detektionsapparatur und der Auflosung des Grauwertbildes ab. 
Sie konnen beispielsweise ein typisches Verteilungsmuster von 
Helligkeits-Intensitatswerten iiber einer den Bildpunkt 
umgebenden Matrix darstellen. Die dazu verwendbaren Methoden 
der Bi Ids egmentie rung reichen von einfachen Schwellwert- 
verfahren bis hin zur Verwendung neuronaler Netze. 

Erf ullt ein Bildpunkt (x,y) diese Anf orderungen, dann folgt 
ein Vergleich mit den Koordinaten von in bisher durchgefuhrten 
Sequenzierungszyklen identif izierten NSKFs. Bei einer Uber- 
einstimmung erfolgt die Zuordnung des Signals mit dem aus dem 
jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem 
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NSKF. Signale mit nicht ubereinstimmenden Koordinaten werden 
als Hintergrundsignale bewertet und verworfen. Die Analyse der 
Signale kann parallel zum Scanvorgang erfolgen. 

In einer beispielhaften Ausfuhrung wurde ein 
8-Bit-Grauwertbild mit einer Auflosung von 1317 x 1035 Pixel 
verwendet. Urn die durch die Digitalisierung entstandenen 
Veranderungen am Bild zu reduzieren, erfolgte zunachst eine 
Vorverarbeitung des Gesamtbildes : Jedem Bildpunkt wurde der 
Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei 
der gewahlten Auflosung entsteht dadurch ein fur einen 
Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt 
mit dem grofiten Helligkeitswert und Nachbarbildpunkten mit 
nach alien Seiten hin abfallenden Helligkeiten. Erfiillte ein 
Bildpunkt diese Kritierien und Uberschritt der zentrifugale 
Helligkeitsabf all einen bestimmten Schwellenwert (zur 
Exklusion zu schwacher Fluoreszenzpunkte) , darm wurde dieser 
zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes 
gewertet . 

d) Verschiebung des Objektivs zur nachsten Position auf der 
Oberflache. Nach der Detektion der Signale einzelner Molekule 
wird das Objektiv liber einer anderen Position der Oberflache 
positioniert . 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der 
Kontrolle der X, Y-Position, der Einstellung der Fokusebene und 
mit der Detektion einzelner Molekule bei jeder neuen Objek- 
tivposition gemacht werden. Diese Schritte konnen durch einen 

» 

Computer gesteuert werden. 

4.7 Zeitlicher Ablauf der Verfahrensschritte 

Der Scanvorgang sowie die biochemische Reaktion nehmen eine 
gewisse Zeit in Anspruch. Wenn man diese Vorgange nacheinander 
schaltet, kann man eine optimale Leistung der Apparatur errei- 
chen. In einer bevorzugten Ausfuhrung wird die Reaktion auf 
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zwei getrennten Oberfla'chen durchgef uhrt . 

Als Beispiel kann eine Oberflache mit gebundenen NSKF-Prirner- 
Komplexen in 2 raumlich isolierte Teile getrennt werden, so 
dass Reaktionen auf diesen beiden Teilen unabhangig 
voneinander ablaufen konnen. In einem anderen Beispiel konnen 
NSKFs auch von vornherein auf 2 getrennten Oberf lachen 
immobilisiert werden. 

Danach wird die Reaktion gestartet. Das Prinzip dabei ist, 
dass wahrend auf einem Teil der Oberflache die Reaktions- und 
Waschschritte ablaufen, der zweite Teil abgescannt wird. 
Dadurch kann man einen kontinuierlichen Ablauf der Analyse 
erreichen und die Geschwindigkeit der Sequenzierung steigern. 

Die Anzahl der Oberf lachen, auf denen die Reaktion ablauf t, 
kann auch grofier als 2 sein. Das erscheint dann sinnvoll, wenn 
die Reaktion als zeitlich limitierender Schritt auftritt, d.h. 
die Detektion der Signale auf der Oberflache schneller als die 
Reaktions- und Waschschritte ablauf t. Urn die Gesamtdauer der 
Reaktion an die Detektionsdauer anzupassen, kann jeder 
einzelne Schritt der Reaktion auf einer einzelnen Oberflache 
mit einer zeitlichen Verzogerung im Vergleich zur nachsten 
Oberflache ablaufen. 

Die Erfindung wird nachfolgend anhand von Beispielen verdeut- 
licht . 
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Beispiele 

Beispiel 1: 

Sequenzanalyse mit 4 markierten NTs* 

Bei einer bevorzugten Ausfuhrungsf orm der Erfindung werden 
alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
farbstoffen markiert. 

1A. Rekonstruktion der ursprunglichen Sequenzen nach dem 
Schrotschufi- Prinzip ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 
1996 v.33 S.21, Bonfield et al . NAR 1995 v. 23 S.4992, 
Miller et al . J. Comput . Biol . 1994 v.l S.257). (Dieses 
Prinzip ist insbesondere bei der Analyse neuer, unbekann- 
ter Sequenzen geeignet . ) 

lA-lSequenzierung eines langen DNA-Stiicks 

Im folgenden soli anhand der Sequenzierung eines 1Mb 
langen DNA-Stiickes schematisch die Sequenzierung langer 
Nukleinsaureketten dargestellt werden (Fig. 1) . Der 
Sequenzierung liegt das Shotgun- Prinzip zugrunde 
("Automated DNA sequencing and analysis" S. 231 ff. 1994 
M. Adams et al. Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et 
al. NAR 1995 v. 23 S.4992, Miller et al. J.Comput .Biol . 
1994 v.l S.257). Das zu analysierende Material wird fur 
die Sequenzierungsreaktion vorbereitet, indem es in 
Fragmente von vorzugsweise 50 bis 1000 bp Lange zerlegt 
wird. Jedes Fragment wird anschliefiend mit einer 
Primerbindungsstelle und einem Primer versehen. Dieses 
Gemisch aus verschiedenen DNA- Fragment en wird nun auf 
einer planen Oberflache fixiert. Die nicht gebundenen DNA- 
Fragmente werden durch einen Waschschritt entfernt. Danach 
wird die Sequenzierungsreaktion an der gesamten Reaktions- 
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oberflache durchgef uhrt . Zur Rekonstruktion einer 1 Mb 
langen DNA- Sequenz soil ten die Sequenzen von NSKFs 
vorzugsweise langer als 300 NTs sein, durchschnittlich ca. 
400 bp. Da pro Zyklus nur jeweils ein markiertes NT* 
eingebaut wird, sind mindestens 400 Zyklen zur 
Sequenzierung notwendig. 

Insgesamt ist zur Rekonstruktion der urspriinglichen 
Sequenz die etwa 10- bis 100 -f ache Menge an Rohsequenzen 
erforderlich, d.h. 10 bis 100 Mb. Bei einer 
durchschnittlichen Sequenzlange von ca, 400 bp pro NSKF 
benotigt man entsprechend 25.000 bis 250.000 DNA- 
Fragmente, urn mehr als 99,995% der Gesamtsequenz 
abzudecken . 



Die ermittelten NSKF- Sequenzen stellen.eine Population von 
uberlappenden Teilsequenzen dar, die sich rait kommerziell 
erhaltlichen Programmen zur Gesamtsequenz der NSK 
zusammenfiigen lassen ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al . Academic Press , 
Huang et al. Genom Res. 19 99 v. 9 S.868, Huang Genomics 
1996 v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J.Comput .Biol. 1994 v.l S.257). 

1A- 2 Sequenzierung der Genprodukte am Beispiel der cDNA-Sequen- 

zierung 

In einer bevorzugten Ausfiihrungsform konnen statt einer 
Sequenz mehrere Sequenzen in einem Ansatz analysiert 
werden. Die urspriinglichen Sequenzen konnen aus den 
gewonnen Rohdaten z.B. nach dem SchrotschuS-Prinzip 
rekonstruiert werden. 

Zunachst werden NSKFs erzeugt. Man kann z.B. mRNA in eine 
doppelstrangige cDNA uberfiihren und diese cDNA mit Ul- 
traschall f ragmentieren. Anschliefiend werden diese NSKFs 
mit einer Primerbindungsstelle versehen, denaturiert, 
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immobilisiert und" mit einem Primer hybridisiert . Zu 
beachten ist bei dieser Variante der Probenvorbereitung, 
dass die cDNA-Molekiile unvollstandige . mRNA-Sequenzen 
darstellen konnen (Method in Enzymology 1999, v. 303, S.19 
und andere Artikel in diesem Band, 11 cDNA library 
protocols" 1997 Humana Press) . 

Eine andere Moglichkeit bei der Generierung 
einzelstrangiger NSKFs von mRNA besteht in der reversen 
Transkription der mRNA mit randomisierten Primern. Dabei 
werden viele relativ kurze antisense DNA-Fragmente 
gebildet (Zhang- J et al. Biochem.J. 1999 v. 337 S.231, 
Ledbetter et al - J.Biol.Chem. 1994 v. 269 S. 31544, Kolls et 
al. Anal.Biochem. 1993 v. 208 S.264, Decraene et al . 
Biotechniques 1999 v. 27 S.962). Diese Fragmente konnen 
anschlieEend mit einer Primerbindungstelle versehen werden 
(s.o). Weitere Schritte entsprechen oben beschriebenen 
Vorgangen. Mit dieser Methode konnen komplette mRNA- 
Sequenzen (vom 5 1 - bis zum 3»-Ende) analysiert werden, da 
die randomisierten Primer uber die gesamte Lange der mRNA 
binden . 

Immobilisierte NSKFs werden mit einer der oben angefuhrten 
Ausfuhrungsformen der Sequenzierung analysiert. Da mRNA- 
Sequenzen wesentlich weniger repetitive Sequenzen 
aufweisen als z.B. genomische DNA, kann die Anzahl der 
detektierten Signale der eingebauten NTs* von einem NSKF 
geringer als 3 00 sein und liegt vorzugsweise zwischen 20 
und 1000. Die Anzahl der NSKFs, die analysiert werden 
mussen, errechnet sich nach denselben Prinzipien wie bei 
einer Schrotschufi-Rekonstruktion einer langen Sequenz. 

Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot- 
schxifi-Verfahrens die ursprunglichen Gensequenzen rekon- 
struiert . 

Diese Methode erlaubt die gleichzeitige Sequenzierung von 
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vielen mRNAs ohne vorherige Klonierung. 

IB. Analyse von Sequenz variant en 

Die Bestatigung einer bereits bekannten Sequenz oder der 
Nachweis von Varianten dieser Sequenz stellt sehr viel 
geringere Anspruche an die Lange und Redundanz der 
ermittelten NSKF- Sequenzen. Auch die Sequenzbearbeitung 
ist in diesem Fall einfacher. Die Vollsequenz braucht 
nicht neu rekonstruiert zu werden. Die NSKF - Sequenz en 
werden vielmehr mit Hilfe eines kommerziell erhaltlichen 
Programms der Vollsequenz zugeordnet und eventuelle 
Abweichungen detektiert. Einem solchen Programm kann z.B. 
BLAST oder FASTA Algorithmus zugrunde liegen 
("Introduction to computational Biology" 1995 M.S. 
Waterman Chapman & Hall) . 

Die zu analysierende Sequenz wird mit einer der oben 
genannten Methoden in NSKFs uberfiihrt. Diese NSKFs werden 
mit dem erf indungsgemaSen Verfahren sequenziert, wobei man 
sowohl einen einheit lichen Primer und eine einheitlihe 
Primerbindungss telle als auch unterschiedliche, 

sequenzspezif ische Primer und naturliche, in der zu 
unt e r suchenden Ge s amt s e quen z vor kommende 

Primerbindngsstellen verwenden kann. AnschlieSend werden 
die emit tel ten Sequenzen von NSKFs nicht nach dem Schrot- 
schufi- Verfahren zusammengestzt , sondern mit der Referenz- 
sequenz verglichen und auf diese Weise ihren Positionen in 
der Vollsequenz zugeordnet . Dabei kann es sich urn 
genomische oder cDNA- Sequenzen handeln. 

Im Gegensatz zu einer Rekonstruktion nach dem SchrotschuS- 
Verfahren braucht man fur die Analyse einer 
Sequenzvariante erheblich weniger Rohsequenzdaten. So kann 
die 5- bis 10- fache Rohsequenzmenge ausreichend fur die 
Wiederherstellung einer neuen Variante einer Vollsequenz 
sein. Mit dem SchrotschuS-Verfahren wird fur eine 



WO 03/020968 



54 



PCT/EP02/09614 



Wiederherstellung ' eine 10- bis 100-fache Menge an 
Rohsequenzen benotigt ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, 
Huang et al. Genom Res. 1999 v. 9 s.868, Huang Genomics 
1996 v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J. Comput .Biol . 1994 v.l S.257). 

Die Lange der ermittelten NSKF-Sequenzen soli fur eine 
eindeutige Zuordnung zu einer bestimmten Position in der 
Referenzsequenz ausreichend sein, so konnen z.B bereits 
Sequenzen mit einer Lange von 20 NTs (z.B. aus nicht 
repetitiven Abschnitten im menschlichen Genom) eindeutig 
identifiziert werden. Fur die Vergleichsanalyse der repet- 
itiven Abschnitte werden langere Sequenzen benotigt. Die 
genaue Lange der Sequenzen hangt dabei von der Aufgaben- 
stellung ab. Vorzugsweise betragt die Lange der ermittel- 
ten NSKF-Sequenzen bei der Analyse von nicht repetitiven 
Abschnitten mehr als 20 NTs. Fur die Analyse der 
repetitiven Abschnitte liegt sie vorzugsweise uber 500 
NTs . 

Die Zielsetzungen bei der Sequenzierung neuer Varianten 
einer bereits bekannten Vollsequenz konnen sehr unter- 
schiedlich sein. Meist wird ein Vergleich der neu 
ermittelten Sequenz mit der bekannten 

Vollsequenz/Referenzsequenz angestrebt. Dabei kdnnen die 
beiden Sequenzen aus evolutionar unterschiedlich weit aus- 
einanderliegenden Spezies stammen. Verschiedene Parameter 
der Zusammensetzung dieser beiden Sequenzen kdnnen 
verglichen werden. Als Beispiele fur eine solche Analyse 
dienen: Mutations- oder Polymorphismusanalysen und die 
Analyse von alternativ gespleiSten Genprodukten . 

Nachfolgend soil schematisch und beispielhaft ein 
Vergleich der zu untersuchenden Sequenz mit einer 
Referenzsequenz ohne vorherige Rekonstruktion der zu 
analysierenden Sequenz betrachtet werden. Ein solcher 
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Vergleich kann z.B. zur Mutations- oder SNP-Analyse 
dienen . 



Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in 
NSKFs mit einer der oben genannten Methode geteilt. Diese 
NSKFs werden unter Verwendung einheitlicher Primer mit dem 
erfindungsgemafien Verfahren sequenziert. Die ermittelten 
Sequenzen von jedem einzelnen NSKF werden direkt mit der 
Referenzsequenz verglichen. Die Ref erenzsequenz dient 
dabei als Grundlage fur die Zuordnung ermittelter NSKF- 
Sequenzen, so dass die aufwendige Rekonstruktion nach dem 
SchrotschuS- Verfahren entfallt. Vorzugsweise betragt die 
Lange der ermittelten NSKF-Sequenzen bei der Analyse von 
nicht-repetitiven Abschnitten mehr als 20 NTs. Fur die 
Analyse der repetitiven Abschnitte liegt sie vorzugsweise 
uber 500 NTs. Die Anzahl der zu analysierenden NSKFs 
richtet sich dabei nach der Gesamtlange der zu 
untersuchenden Sequenz, der durchschnitt lichen Lange der 
NSKF-Sequenzen und der notwendigen Genauigkeit der Sequen- 
zierung. Bei einer durchschnittlichen Lange der 
ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlange 
der zu untersuchenden Sequenz von 1 Mb und einer 
Genauigkeit, die der Rohsequenzermittlung entspricht (d.h. 
jede Stelle soli moglichst nur einmal sequenziert werden) 
benotigt man z.B. die ca. 5-fache Menge an Rohsequenzen, 
d.h. 5 Mb, weil die Verteilung der NSKFs uber die 
Gesamt sequenz zufallig erfolgt. Insgesamt miissen 50.000 
NSKFs analysiert werden, urn mehr als 99% der Gesamtstrecke 
abzudecken . 

AnschlieSend werden die ermittelten NSKF-Sequenzen mit 
Hilfe eines kommerziell erhaltlichen Programms der 
Vollsequenz zugeordnet und eventuelle Abweichungen 
detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
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computational Biology" 1995 M.S. Waterman Chapman & Hall) . 
Beispiel 2: 

Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

In einer anderen Ausf uhrungsf orm werden fur die. Analyse der 
Sequenzen 2 modifizierte NTs* und 2 unmodif izierte NTs einge- 
setzt . 

Diese Methode eignet sich besonders zur Analyse der Sequenzva- 
rianten (z.B. SNP- oder Mutationsanalyse) und setzt die 
Kenntnis einer Ref erenzsequenz voraus. Dabei wird die 
Vollsequenz nicht rekonstruiert , sondem die ermittelten 
Sequenzen werden mit Hilfe eines Programms der Ref erenzsequenz 
zugeordnet und eventuelle Abweichungen registriert . Einem 
solchen Programm kann z.B. der BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

Diese Ausfiihrungsf orm beruht auf dem Prinzip, dass eine 
Abfolge aus 2 Signalen (markierte NT's) genugend Inf ormationen 
zur Identif izierung einer Sequenz enthalten kann. Die 
ermittelte Sequenz wird mit der Ref erenzsequenz verglichen und 
einer bestimmten Position zugeordnet, z.B.: 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Ref erenzsequenz 

A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC (Ref erenzsequenz ) 
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Die unbekannte, zu analysierende Variants der Referenzsequenz 
wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK 
wird in NSKFs uberfuhrt, diese werden mit PBS ligiert, 
anschliefiend mit einem Primer hybridisiert und auf 
Reaktionsoberf lache immobilisiert) . Auf diese Weise 
vorbereitete NSKFs werden mit 2NTs72NTs-Methode sequenziert . 
Man erhalt NSKF- Sequenz en, wobei jede NSKF-Sequenz -eine 
Abfolge aus 2NTs* darstellt. Urn eine eindeutige Zuordnung der 
ermittelten Sequenz zu einer bekannten Referenzsequenz zu 
ermoglichen, muS diese Abfolge lang genug sein. Vorzugsweise 
betragt die Lange der ermittelten NSKF-Sequenzen mehr als 40 
NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz 
darstellen, ist die Gesamtlange des synthetisierten 
komplementaren Strangs ca. doppelt so lang, wie die Abfolge 
der detektierten NTs* (bei 40 detektierten NTs* betragt die 
Gesamtlange z.B. durchschnittlich 80 NTs). 

Zur Synthese eines komplementaren Stranges werden 4 Nukleotide 
benotigt. Da die mit einem Fluoreszenzf arbstof f markierten 
NTs* in der vorliegenden Erfindung als Semiterminatoren 
auftreten, d.h. die Termination ausschlieSlich bei 
Verfiigbarkeit modif izierter NTs* auftritt, miissen 
unmodifizierte NTs in einem zusatzlichen Schritt in jedem 
Zyklus in die Reaktion zugegeben werden. Die genaue Position 
dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei 
ist, dass die markierten NTs* und die unmodifizierte NTs 
getrennt verwendet werden. 

Ein Zyklus bei dieser Aus fiihrungs form kann beispielhaf t 
folgendermaSen aussehen: 

a) Zugabe einer Losung mit modif izierten NTs' und Polymerasen 
auf die Oberflache mit den bereitgestellten NSKFs 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur Verlangerung der 
komplementaren Strange urn ein NT geeignet sind 

c) Waschen 
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d) Detektion der Signale von einzelnen, modif izierten und in 
die den NSKFs komplementaren neusynthetisierten Strangen 
eingebauten NTs'-Molekulen 

e) Entfernung der Markierung und der terminierenden Gruppe 
bei den eingebauten Nukleotiden 

f) Waschen 

g) Zugabe von 2 unmodif izierten NTs und Polymerasen 

h) Waschen. 

¥ 

Diese 23STT*s/2NTs-Methode eignet sich beispielsweise fur die 
SNP-Analyse einer genomischen Strecke eines Gens oder fur 
doppelstrangige cDNA-Analyse . Ihr liegen folgende Prinzipien 
zugrunde : 

1) Die genetische Information in jedem der beiden kom- 
plementaren DNA-Strange ist identisch, so dass fehlende 
Informationen in einem Strang durch die Information aus 
dem anderen Strang vervollstandingt werden konnen. 

2) Durch bestimmte Paarkombinationen markierter NTs* kann man 
mit nur 2 NTs* die komplette Information aus einer doppel- 
strangigen DNA erhalten. Zulassige Kombinationen von NT*s 
bei dieser Aus fuhrungs form sind: A*C*; A*G* ; C*T # /C*U*; 
G*T*/G*U*. Bevorzugt wird die Kombination C* und U*. 

3) Als Grundlage der Analyse dient eine bereits bekannte 
Ref erenzsequenz . 

4) Die NSKFs stammen von beiden Strangen der zu 
analysierenden NSK und • die ermittelten NSKF-Sequenzen 
decken die gesamte Lange der zu analysierenden Sequenz ab. 

Am folgenden Beispiel wird erklart, wie die Information aus 
einem doppelstrangigen DNA-Pragment mit nur 2 markierten NTs* 
gewonnen wird und wie die Unterschiede zur urspriinglichen oder 
nicht mutierten Sequenz (Ref erenzsequenz / Vergleichsequenz) 
festgestellt werden konnen. Sequenzen unter (1) und (2) sind 
bis auf eine Stelle identisch (unterstrichen) . A* und C* sind 
markiert . 
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1) zu prufende Seguenz: 

Die zu prufende Sequenz wird mit 2NT*s/2NTs-Methode 
sequenziert, so dass eine Population an NSKF-Sequenzen 
(ermittelte NSKF-Sequenzen (n) ) entsteht. Diese ermittelten 
NSKF-Sequenzen enthalten Information von jedera Strang: 

5 , A-C---C-AAA-A-C-A-C-CC3' - ermittelte NSKF - Sequenz (i) 
5 1 ATCGTTCGAAATATCGATCGCCTG3 1 
3 1 TAGCAAGCTTTATAGCTAGCGGAC5 1 

3' A-CAA-C A-A-C-A-C C5 ' - ermittelte NSKF -Sequenz (i+1) 

2 ) Vergleichsequenz : 

Zur Analyse ist eine Vergleichsequenz (Ref erenzsequenz) 
erforderlich: 

5 ' ATTGTTCGAAATATCGATCGCCTG3 1 
3 1 TAACAAGCTTTATAGCTAGCGGAC5 1 

3) Vergleichsequenz mit angepaSten ermittelten NSKF-Sequenzen: 

Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen 
bestimmten Stellen in der Vergleichsequenz zugeordnet und 
eventuelle Abweichungen detektiert: 

5'A-C C-AAA-A-C-A-C-CC3 ' - ermittelte NSKF - Sequenz (i) 

5 1 ATTGTTCGAAATATCGATCGCCTG3 1 
3 1 TAACAAGCTTTATAGCTAGCGGAC5 1 

3' A-CAA-C---A-A-C-A-C---C5' - ermittelte NSKF -Sequenz (i+1) 
ft 

(Einzelnukleotidmutation) 

Mit dieser Ausfuhrungsform kann man eine doppelstrangige 
Nukleinsaure auf SNP oder Mutationen untersuchen. Dabei werden 
die ermittelten NSKF-Sequenzen mit einer Ref erenzsequenz 
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verglichen. Die Grundregeln des Vergleichs einer Teilsequenz 
und einer kompletten Sequenz bei der Analyse mit nur 2 
markierten NTs unterscheiden sich nicht prinzipiell von denen, 
die bei dem Vergleich der Sequenzen anhand aller 4 markierten 
NTs* gelten. Naheres s. Sequenzvergleich bei Mutationsanalyse 
und SNP-Analyse mit 4NTs* (Beispiel IB) . 

Beispiel 3 : Analyse der Genexpression 

Die Grundprinzipien der Sequenzierungsreaktion bei der 
Genexpressionsanalyse entsprechen denen der 

Sequenzierungsreaktion langer NSKs (Fig. 7) . Die 
Grundprinzipien zur Durchf uhrung eines Reaktionszyklus (die 
Wahl der NT*-Struktur, der Polymerase, der 

Reaktionsbedingungen fur die NT*-Einbaureaktion und die 
Abspaltungsreaktion) , sowie zur Detektion der Signale von 
eingebauten NT*, entsprechen denen im Verfahren zur 
Sequenzierung langer NSKs. Die wesentlichen Unterschiede 
zwischen beiden Verfahren liegen in der Materialauswahl und - 

* - 

Vorbereitung und in der Verarbeitung der gewonnenen Daten. 

Auswahl des Materials : 
Genprodukte konnen von verschiedenen biologischen Objekten 
stammen, so z.B. von einzelnen Zellen, Zellpopulationen, 
einem Gewebe oder von kompletten Organismen. Auch biologische 
Flussigkeiten wie Blut, Sputum oder Liquor konnen als Quelle 
der Genprodukte dienen. Die Methoden zur Gewinnung der 
Genprodukte aus den verschiedenen biologischen Objekten sind 
bespielsweise folgenden Literaturquellen zu entnehmen: 
"Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor 
Laboratory , "Method in Enzymology" 1999, v303, "cDNA library 
protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.. 

Es kann sowohl die Gesamtheit der isolierten Genprodukte als 
auch ein durch eine Vorselektion ausgewahlter Teil davon in 
die Sequenzierungsreaktion eingesetzt werden. Durch 
Vorselektion kann man die Menge der zu analysierenden 
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Genprodukte reduzieren*. Die Vorselektion kann beispielsweise 
durch molekularbiologische Verfahren wie z.B. PCR- 
Amplif ikation, Gel-Auf trennung oder Hybridisierung mit 
anderen Nukleinsaureketten erfolgen ("Molecular cloning" 
1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method 
in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 
I.G- Cowell, Humana Press Inc.) 

Vorzugsweise wird die Gesamtheit der Genprodukte als 
Ausgangsmaterial gewahlt . 

Vorbereituncr des Materials : 

Ziel der Vorbereitung des Materials ist es, aus dem Ausgangs- 
material an die Oberflache gebundene, extensions!: ahige 
Genprodukt-Primer-Komplexe zu bilden. Wobei pro Genprodukt 
maximal nur ein Primer binden sollte. 

Primerbindungsstelle (PBS) : 
Jedes Genprodukt hat vorzugsweise nur eine 

Primerbindungsstelle . 

Eine Primerbindungsstelle ist ein Sequenzabschnitt , der eine 
selektive Bindung des Primers an das Genprodukt ermoglichen 
soil . 

Als Primerbindungsstellen konnen Abschnitte in der 
Nukleinsauresequenz dienen, die in den zu analysierenden 
Sequenzen natiirlicherweise vorkommen (z.B. polyA-Strecken in 
mRNA) . Eine Primerbindungsstelle kann auch zusatzlich in das 
Genprodukt eingefuhrt werden (Molecular cloning" 1989, Ed. 
Maniatis, Cold Spring Harbor Laboratory , "Method in 
Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 
I.G. Cowell, Humana Press Inc.). 

Aus Grunden der Vereinf achung der Analyse kann es wichtig 
sein, dass eine moglichst einheitliche Primerbindungsstelle in 
alien Genprodukten vorhanden ist. Darin konnen Primer mit 
einheitlicher Struktur in die Reaktion eingesetzt werden. 
Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
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schrankt. Ihre Lange betragt vorzugsweise zwischen 10 unci 100 
NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe 
tragen, beispielsweise zur Bindung des Genprodukts an die 
Oberflache. Diese funktionelle Gruppe kann z.B. eine Biotin- 
oder Digoxigenin-Gruppe sein. 

Als Beispiel fur die Einfuhrung einer Primerbindungsstelle in 
die Genprodukte wird das Nukleotid-Tailing von antisense cDNA- 
Fragmenten beschrieben. 

Als erstes werden einzelstrangige cDNAs von mRNAs 
synthetisiert . Es resultiert eine Population an cDNA- 
Molekulen, die eine Kopie der mRNA- Population darstellen, 
sogenannte ant i sense -cDNA. (Molecular cloning" 1989, Ed. 
Maniatis, Cold Spring Harbor Laboratory , "Method in 
Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 
I.G. Cowell, Humana Press Inc.). Mit einer terminalen 
Deoxynucleotidyltransf erase kann man mehrere (z.B. zwischen 10 
und 20) Nukleosid-monophosphate an das 3 1 -Ende dieser 
antisense cDNA ankniipfen, z.B. mehrere Adenosin-Monophosphate 
((dA)n-Tail genannt) . Das entstehende Fragment wird zur 
Bindung des Primers, in diesem Beispiel eines (dT) n- Primers , 
verwendet ("Molecular cloning" 1989 J.Sambrook et al . Cold 
Spring Harbor Laborotary Press, "Method in Enzymology" 1999 
v. 303, S. 37-38) . 

Primer fur die Seauenzierunqsreaktion; 
Dieser hat die Funktion, den Start an einer einzigen Stelle 
des Genprodukts zu ermoglichen. Vorzugsweise bindet er an die 
Primerbindungsstelle im Genprodukt. Die Zusammensetzung und 
die Lange des Primers sind nicht eingeschrankt . Aufier der 
Start funktion kann der Primer auch andere Funktionen 
libernehmen, wie z.B. eine Verbindung der Genprodukt -Primer - 
Komlexe zur Reaktionsoberf lache zu schaffen. Primer sollten so 
an die Lange und Zusammensetzung der Primerbindungsstelle 
angepafit werden, dass der Primer den Start der Sequenzie- 
rungsreaktion mit der jeweiligen Polymerase ermoglicht. 
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Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 3 0 NTs . Der Primer kann 
eine funktionelle Gruppe tragen, die beispielsweise zur 
Bindung des Primers an die Oberflache dient, beispielsweise 
ist eine solche funktionelle Gruppe eine Biotingruppe (s. 
Abschnitt Immobilisierung) . Sie soil die Sequenzierung nicht 
storen. Die Synthese eines solchen Primers kann z.B. mit dem 
DNA- Synthesizer 380 A Applied Biosystems ausgefiihrt werden 
oder aber als Auft rags synthese bei einem kommerziellen 
Anbieter, z.B. MWG-Biotech GmbH, Deutschland, erstellt werden. 

Es konnen auch unterschiedliche Primer verwendet werden, ein 
definierter Primersatz, oder ein Primergemisch. 

Der Primer kann vor der Hybridisierung an die zu 
anaiysierenden Fragmente auf der Oberflache mit verschiedenen 
Techniken fixiert oder direkt auf der Oberflache synthetisiert 
werden beispielsweise nach (McGall et al. US Patent 5412087, 
Barrett et al. US Patent 5482867, Mirzabekov et al . US Patent 
5981734, "Microarray biochip technology" 2000 M.Schena Eaton 
Publishing, "DNA Microarrays" 1999 M. Schena Oxford University 
Press, Fodor et al . Science 1991 v. 285 S.767, Timofeev et al . 
Nucleic Acid Research (NAR) 1996, v. 24 S.3142, Ghosh et al . 
NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v. 15 S.5373, 
Maskos et al . NAR 1992 v. 20 S.1679). 

Die Primer werden auf der Oberflache in einer Dichte zwischen 
10 bis 100 pro 100 pm 2 , 100 bis 10.000 pro 100 /xm 2 , 10.000 bis 
1.000.000 pro 100/xm 2 oder groSer als 1.000.000 pro 100 jzm 2 
gebunden . 

■ 

Der Primer oder das Primergemisch wird mit Genprodukten unter 
Hybridisierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle jedes Genprodukts binden lassen. Diese 
Primer-Hybridisierung (Annealing) kann vor (l) , wahrend (2) 
oder nach (3) der Bindung der Genprodukte an die Oberflache 
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erfolgen. Falls Genprodukte als doppelstrangige Nukleinsauren 
vorliegen, werden sie vor der Hybridisierung durch Hitze 
denaturiert ("Molecular cloning" 1989 J.Sambrook et al. Cold 
Spring Harbor Laborotary Press) . Die Optimierung der 
Hybridisierungsbedingungen hangt von der genauen Struktur der 
Primerbindungsstelle und des Primers ab und laSt sich nach 
Rychlik et al. (NAR 1990 v. 18 S.6409) berechnen. Im folgenden 
werden diese Hybridisierungsbedingungen als standardisierte 
Hybridisierungsbedingungen bezeichnet. 

Falls das Ausgangsmaterial eine poly-A-Strecke oder eine poly- 
dA-Strecke aufweist (z.B. mRNA, sense cDNA oder antisense-cDNA 
mit (dA) n -Tail) kann man einen oligo-dT-Primer verwenden . Es 
kann allerdings auch ein Primergemisch bestehend aus 12 
verschiedenen Primern mit folgender allgemeiner Struktur 
5'(K) n MN3' verwendet werden. Wobei (n) zwischen 10 und 50 
liegt, vorzugsweise zwischen 20 und 30. "K" steht fur dT oder 
dU, "M" und "N" stehen jeweils fur dA, dT oder dU, dC, dG 
(z .B.5"- dTdTdTdTdTdTdTdTdTdT 10 dTdTdTdTdTdTdTdTdTdT 20 dAdG- 3 " ) . 
Ein solches Primergemisch ermoglicht einen exakten Start der 
Sequenzierungsreaktion am Ende der polyA-Strecke oder der 
poly-dA-Strecke (geankerter Primer) . 

Fixierung von Genprodukt -Primer -Komplexen an die Oberflache 
(Bindung bzw. Immobilisierung von Genprodukten) : 

Ziel der Fixierung (Bindung, Immobilisierung) ist es, 
Genprodukt - Primer- Komplexe auf einer geeigneten planen 
Oberflache in einer Art und Weise zu fixieren, dass eine 
zyklische enzymatische Sequenzierungsreaktion ablaufen kann. 
Dies kann beispielsweise durch Bindung des Primers (s.o.) oder 
des Genprodukts an die Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Bindung von Genprodukt - 
Primer- Komplexen kann variabel sein: 

4) Die Genprodukt -Primer-Komplexe konnen zunachst in einer 
Losung durch Hybridisierung (Annealing) gebildet und 
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anschlieSend an die Oberflache gebunden werden. 

5) Primer konnen zunachst auf einer Oberflache gebunden 
werden und Genprodukte anschlieSend an die gebundenen 
Primer hybridisiert werden, wobei Genprodukt -Primer - 
Komplexe entstehen (Genprodukte indirekt an die 
Oberflache gebunden) 

6) Die Genprodukte konnen zunachst an die Oberflache 
gebunden werden (Gendprodukte direkt an die Oberflache 
gebunden) und im anschlieiSenden Schritt die Primer an 
die gebundenen Genprodukte hybridisiert werden, wobei 
Genprodukt -Primer -Komplexe entstehen . 

Die Immobilisierung der Genprodukte an die Oberflache kann 
daher durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf lache sind in dieser Anmeldung 
als gleichwertige Begriffe aufzufassen, aufier wenn explizit 
auf eine andere Bedeutung hingewiesen wird. Als Reaktionsober- 
flache dient die Oberflache einer festen Phase eines 
beliebigen Materials. Dieses Material ist vorzugsweise 
enzymatischen Reaktionen gegenuber inert und verursacht keine 
Storungen der Detektion. Silicon, Glas, Keramik, Kunststoff 
(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
oder Aluminium) oder beliebiges anderes Material, das diesen 
funktionalen Anf orderungen geniigt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 

Falls eine gelartige feste Phase (Oberflache eines Gels) 
verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekule 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 5 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf lache 
hat anderen festen Oberflachen gegenuber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt . Durch die Bindung der Genprodukt- 
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Primer- Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale 
von freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht imraobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt. 
Diese feste Unterlage kann Silicon, Glas, Keramik, Kunststoff 
(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
oder Aluminium) oder beliebiges anderes Material sein. 
Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 
mm. Die Geldicke ist jedoch vorzugsweise groSer als die 
einfache Tief enscharf e des Objektivs, damit unspezifisch an 
die feste Unterlage gebundene NTs* nicht in die Fokusebene 
gelangen und damit detektiert werden. Wenn die Tief enscharf e 
z.B. 0,3 pm betragt, so liegt die Geldicke vorzugsweise 
zwischen 1 pm und 100 pm. Die Oberflache kann als eine 
kontinuierliche Oberflache oder als diskontinuierliche, aus 
einzelnen kleinen Bestandteilen (z.B. Agarose-Kiigelchen) 
zusammengesetzte Oberflache hergestellt werden. Die 
Reaktionsoberf lache muS groS genug sein, urn die notwendige 
Anzahl der Genprodukte bei entsprechender Dichte binden zu 
kdnnen. Die Reaktionsoberf lache sollte vorzugsweise nicht 
groSer als 20 cm 2 sein. 

Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionslosungen uber der Oberflache. Die 
Reaktionsoberf lache ist vorzugsweise Bestandteil eines Reak- 
tionsgef aSes . Das Reaktionsgef afi ist wiederum vorzugsweise 
Bestandteil einer Reaktionsapparatur mit Durchf luSvorrichtung. 
Die Durchf luSvorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgef aS. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung oder manuell 
erfolgen. Wichtig dabei ist, dass die Oberflache nicht ' 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgef afies weniger als 50 pi. Idealerweise betragt sein 
Volumen weniger als 1 pi. 

Falls die Fixierung der Genprodukt- Primer- Komplexe auf der 
Oberflache uber die Genprodukte erfolgt, kann dies 
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beispielsweise durch die Bindung der Genprodukte an einem der 
beiden Ketten-Enden erfolgen. Dies kann durch entsprechende 
kovalente, affine oder andere Bindungen erreicht werden. Es 
sind viele Beispiele der Immobilisierung von Nukleinsauren 
bekannt (McGall et al. US Patent 5412087, Nikiforov et al . US 
Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov 
et al. US Patent 5981734, "Microarray biochip technology" 2000 
M.Schena Eaton Publishing, "DNA Microarrays " 1999 M. Schena 
Oxford University Press, Rasmussen et al. Analytical 
Biochemistry v. 198, S.13 8, Allemand et al. Biophysical Journal 
1997, v. 73, S.2064, Trabesinger et al. Analytical Chemistry 
1999, v. 71, S.279, Osborne et al. Analytical Chemistry 2000, 
v.72, ' S.3678, Timofeev et al. Nucleic Acid Research ■ (NAR) 
1996, v.24 S.3142, Ghosh et al. NAR 1987 v. 15 S.5353, Gingeras 
et al. NAR 1987 v. 15 S.5373, Maskos et al . NAR 1992 v. 20 
S.1679). Die Fixierung kann auch durch eine unspezif ische 
Bindung, wie z.B. durch Austrocknung der Genprodukte 
enthaltenden Probe auf der planen Oberflache erreicht werden. 
Die Genprodukte werden auf der Oberflache in einer Dichte 
zwischen 10 und 100 pro 100 ym 2 , 100 bis 10.000 pro 100 /im 2 , 
10.000 bis 1000.000 pro 100/xm 2 gebunden. 

Die fur die Detektion notwendige Dichte von extensionsf ahigen 
Genprodukt- Primer- Komplexen betragt ca. 10 bis 100 pro 100 
/xm 2 . Sie kann vor, wahrend oder nach der Hybridisierung der 
Primer an die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
naher dargestellt: 

In einer Ausfuhrungsform erfolgt die Bindung der Genprodukt - 
Primer-Komplexe uber Biotin-Avidin oder Biotin-Streptavidin- 
Bindung. Dabei wird Avidin oder Streptavidin auf der 
Oberflache kovalent gebunden, das 5'-Ende des Primers ist mit 
Biotin modifiziert. Nach der Hybridisierung der modif izierten 
Primer mit den Genprodukten (in Losung) werden diese auf der 
mit Avidin/Streptavidin beschichteten Oberflache fixiert. Die 
Konzentration der mit Biotin markierten Genprodukt -Primer- 
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Komplexe sowie die Zeit der Inkubation. dieser Losung mit der 
Oberflache wird so gewahlt, dass eine ftir die Sequenzierung 
geeignete Dichte erreicht wird. 

In einer anderen Ausfuhrungsf orm werden die fur die 
Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstrangigen Genprodukte mit 
jeweils einer Primerbindungss telle pro Genproduktmolekul 
werden damit unter Hybridisierungsbedingungen inkubiert 
(Annealing) . Dabei binden sie an die f ixierten Primer und 
werden dadurch an die Oberflache gebunden (indirekte Bindung) . 
Die Konzentration der einzelstrangigen Genprodukte und die 
Hybridisierungsparameter (z.B. Temperatur, Zeit, Puffer) 
werden so gewahlt, dass man eine fur die Sequenzierung ge- 
eignete Dichte von ca. 10 bis 100 extensionsf ahigen 
Genprodukt- Primer- Komplexen pro 100 urn 2 erreicht. Nach der 
Hybridisierung werden ungebundene Genprodukte durch einen 
Waschschritt entfernt. Bei dieser Ausfuhrungsf orm wird eine 
Oberflache mit einer hohen Primerdichte bevorzugt, z.B. ca. 
1.000.000 Primer pro lOOjxm 2 oder noch hoher, da die gewunschte 
Dichte an Genprodukt -Primer- Komplexen schneller erreicht wird, 
wobei die Genprodukte nur an einen Teil der Primer binden. 

In einer anderen Ausfuhrungsf orm werden die Genprodukte an die 
Oberflache direkt gebunden (s.o.) und anschlieSend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 Genprodukte pro 100/xtn 2 wird man versuchen 
alle verfugbaren Genprodukte mit einem Primer zu versehen und 
fur die Sequenzierugnsreaktion verfugbar zu machen. Dies kann 
durch hohe Primerkonzentration beispielsweise 1 bis 100 mmol/1 
erreicht werden. Bei einer hoheren Dichte der f ixierten 
Genprodukte auf der Oberflache, beispielsweise 10.000 bis 
1.000.000 pro 100/itn 2 , kann die fur die optische Detektion 
notwendige Dichte der Genprodukt -Primer -Komplexe wahrend der 
Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
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Primerkonzentratin) so ' zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten Genprodukte binden. 

Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise 
eine Blockierungslosung auf die Oberflache vor dem Schritt (a) 
in jedem Zyklus gebracht, die zur Vermeidung einer unspezifi- 
schen Adsorbtion von NTs* an der Oberflache dient. Diese 
Bedingungen fur eine Blockierlosung erfullt beispielsweise 
eine Albuminlosung (BSA) mit einem pH-Wert zwischen 8 und 10 . 

Wahl der Polymerase: 

Bei der Wahl der Polymerase spielt die Art der verwendeten 
immobilisierten Nukleinsaure (RNA oder DNA) eine 
entscheidende Rolle: 

Falls RNA als Genprodukt (z.B. mRNA) in die 
Seguenzierungsreaktion eingesetzt wird, konnen handelsiibliche 
RNA-abhangige DNA- Polymerasen eingesetzt werden, z.B. AMV- 
Reverse Transcriptase (Sigma) , M-MLV Reverse Transcriptase 
(Sigma), HIV-Reverse Transcriptase ohne RNAse-Aktivitat . Alle 
Reverse Transcriptasen imissen von RNAse-Aktivitat weitgehend 
frei sein ("Molecular cloning" 1989, Ed. Maniatis, Cold 
Spring Harbor Laboratory) . 

Falls DNA als Genprodukt (z.B. cDNA) verwendet wird, eignen 
sich als Polymerasen prinzipiell alle DNA-abhangigen DNA- 
Polymerasen ohne 3 "-5" Exonuklease-Aktivitat (DNA- 
Replication" 1992 Ed. A.Kornberg, Freeman and company NY), 
z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" 

(Amersham Pharmacia Biotech) , Klenow Fragment der DNA- Poly- 
merase I ohne 3'-5 ! Exonukleaseaktivitat (Amersham Pharmacia 
Biotech) , Polymerase Beta verschiedenen Ursprungs (Animal 
Cell DNA Polymerases" 1983, Fry M. , CRC Press Inc., 
kommerziell erhaltlich bei Chimerx) thermostabile Polymerasen 
wie Taq- Polymerase (GibcoBRL) , proHA- DNA- Polymerase 

(Eurogentec) . 
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Detektion: 

Wie bei der Sequenzierung langer NSKs, umfasst die Detektion 
folgende Phasen: 

1) Vorbereitung zur Detektion 

Durchfuhrung eines Detektionsschrittes in jedern Zyklus, wobei 
jeder Detektionsschritt als Scanvorgang ablauft und folgende 
Operationen umfaSt: 

a) Einstellung der Position des Objektivs (X,Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zura jeweiligen 
Genprodukt , 

d) Verschiebung zur nachsten Position auf der Oberflache. 

Die Signale von in die den Genprodukten komplementaren 
Strange eingebauten NTs* werden durch das Abscannen der 
Oberflache registriert. Der Scanvorgang wird wie bei der 
Sequenzieurng langer NSKs durchgef iihrt . Dabei wird das 
Objektiv schrittweise liber die Oberflache bewegt, so daS von 
jeder Oberf lachenposition ein zweidimensionales Bild (2D- 
Bild) entsteht. 

Vorbereituncr zur Detektion: 

Am Anfang wird festgelegt, wie viele Kopien der Genprodukte 
zur Expressionsanalyse notwendig sind. Mehrere Faktoren 
spielen dabei eine Rolle. Die genaue Zahl hangt z.B. von der 
relativen Prasenz der Genprodukte im Ansatz und von der 
gewiinschten Genauigkeit der Analyse ab. Die Anzahl der 
analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 
10.000.000. Fur stark exprimierte Gene kann die Anzahl der 
analysierten Genprodukte niedrig sein, z.B. 1000 bis 10,000. 
Bei der Analyse schwach exprimierter Gene muS sie erhoht 
werden, z.B. auf 100.000 oder noch weiter. 

Es werden bespielsweise 100.000 einzelne Genprodukte 
gleichzeitig analysiert. Dabei werden auch schwach 
exprimierte Gene (mit z.B. ca.100 mRNA-Molekulen/Zelle, was 
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ca. 0.02% gesamt-mRNA entspricht) in der Reaktion mit 

durchschnittlich 20 identif izierten Genprodukten 
reprasentiert . 

2) Durchfiihrung eines Detektionsschrittes in jedem Zyklus 

gleicht der in der Sequenzierung langer NSKs . Anstelle von 
NSKFs werden Genprodukte verwendet. 

Analyse : 

Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines 
Programms mit bekannten Gensequenzen verglichen. Einem 
solchen Programm kann z . B . ein BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

Durch die Wahl der Methode zur Materialvorbereitung wird 
unter anderem festgelegt, in welchen Abschnitten der 
Genprodukte die Sequenzen ermittelt werden und zu welchem 
Strang (sense oder antisense) sie gehoren. Z.B. werden bei 
der Verwendung der polyA-Strecken als Primerbindungsstelle in 
mRNA Sequenzen aus NTRs (non-translating-regions) bestimmt. 
Bei der Verwendung der Methode mit antisense -cDNA als Matrize 
stammen die ermittelten Sequenzen unter anderem aus den 
proteinkodierenden Bereichen der Genprodukte. 

Bei einer bevorzugten einfachen Variante der Erf indung wird 
die Genexpression nur qualitativ bestimmt. Dabei ist nur die 
Tatsache der Expression bestimmter Gene von Bedeutung. 

Bei einer anderen bevorzugten Aus fuhrungs form ist eine 
quantitative Bestimmung der Verhaltnisse zwischen einzelnen 
Genprodukten im Ansatz von Interesse. Es ist bekannt, dafi die 
Aktivitat eines Gens in einer Zelle durch eine Population 
identischer mRNA-Molekule reprasentiert ist. In einer Zelle 
sind viele Gene gleichzeitig aktiv und werden dabei 
unterschiedlich stark exprimiert, was zum Vorhandensein 
vieler verschiedener unterschiedlich stark represent ierter 
mRNA-Populationen fuhrt. 
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Im folgenden wird auf die quantitative Analyse der 
Genexpression naher eingegangen: 

Fiir eine quantitative Analyse der Genexpression werden die 
Abundanzen ' einzelner Genprodukte in der 

Sequenzierungsreaktion bestimmt. Dabei sind die Produkte 
stark exprimierter Gene in der Sequenzierungsreaktion 
haufiger vertreten als die schwach exprimierter Gene. 
Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der 
Anteil der ermittelten Sequenzen fur jedes einzelne Gen 
bestimmt. Gene mit starker Expression haben einen hoheren 
Anteil an der Gesamtpopulation der Genprodukte als Gene mit 
schwacher Expression . 

Die Anzahl der analysierten Genprodukte liegt vorzugsweise 
zwischen 1000 und 10.000.000. Die genaue Anzahl der zu 
analysierenden Genprodukte hangt von der Auf gabenstellung ab. 
Fur stark exprimierte Gene kann sie niedrig sein, z.B. 1000 
bis 10.000. Bei der Analyse schwach exprimierter Gene muE sie 
erhoht werden, z.B. auf 100.00 0 oder hoher. 

Werden bespielsweise 100.000 einzelne Genprodukte 
gleichzeitig analysiert, sind auch schwach exprimierte Gene, 
wie z.B. ca.100 mRNA-Molekule/Zelle (was ca. 0.02% gesamt- 
mRNA entspricht), in der Reaktion mit durchschnittlich 20 
identif izierten Genprodukten reprasentiert . 

Als interne Kontrolle der Hybridisierung, der Immobilisation 
und der Sequenzierungsreaktion laSt sich folgende Methode 
verwenden : 

Es konnen eine oder mehrere Nukleinsaureketten mit bekannten 
Sequenzen als Kontrolle eingesetzt werden. Die 
Zusammensetzung dieser Kontrollsequenzen ist nicht 
eingeschrankt, sofern sie die Identif izierung der Genprodukte 
nicht storten. Bei der Sequenzanalyse der mRNA-Proben werden 
RNA-Kontrollproben, bei der Analyse der cDNA-Proben 
entsprechend DNA-Kontrollproben eingesetzt. Diese Proben 
werden vorzugsweise bei alien Schritten mitgef tihrt . Sie 
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konnen z.B. nach der" mRNA- Isolation zugegeben werden. Im 
allgemeinen werden die Kontrollproben in gleicher Weise zur 
Sequenzanalyse vorbereitet wie die zu analysierenden 
Genprodukte . 

Die Kontrollsequenzen werden in bekannten, fest eingestellten 
Konzentrationen zu den zu analysierenden Genprodukten 
zugegeben. Konzentrationen der Kontrollproben konnen 
unterschiedlich sein, vorzugsweise liegen diese 

Konzentrationen zwischen 0.01% und 10% der 

Gesamtkonzentration der zu analysierenden Probe (100%) . 

Betragt die Konzentration der mRNA beispielsweise lOng/jil, 
dann liegen die Konzentrationen von Kontrollproben zwischen 
lpg/l^l und lng/jil . 

Bei der quantitativen Analyse der Genexpression mufi auch die 
allgemeine metabolische Aktivitat der Zellen beriicksichtigt 
werden, insbesondere, wenn ein Vergleich der Expression 
bestimmter Gene bei verschiedenen auEeren Bedingungen 
angestrebt wird. 

Die Veranderung im Expressionsniveau eines bestimmten Gens 
kann als Folge der Veranderung in der Transkriptionsrate 
dieses Gens oder als Folge einer globalen Veranderung der 
Genexpression in der Zelle auftreten. Zur Beobachtung der 
metabolischen Zustande in der Zelle kann man die Expression 
der sogenannten "House -keeping-Gene" analysieren. Beim Mangel 
an wichtigen Metaboliten ist beispielsweise das allgemeine 
Expressionsniveau in der Zelle niedrig, so daS auch 
konstitutiv exprimierte Gene eine niedriges Expressionsniveau 
haben . 

Im Prinzip konnen alle konstitutiv exprimierten Gene als 
"House-keeping-Gene" dienen. Als Beispiele seien das 
Transf errin-Rezeptor-Gen oder das Beta'-Aktin-Gen genannt . 
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Die Expression dieser House -keeping-Gene dient somit als 
BezugsgroSe fur die Analyse der Expression anderer Gene. Die 
Sequenzermittlung und Quantif izierung der Expression der 
House-keeping-Gene ist vorzugsweise ein Bestandteil des 
Analyse -Programms fur die Genexpression. 

Wie bei der Sequenzierung langer NSKs kann man 
Sequenzierungsreaktion mit 4 markierten oder 2 markierten und 
2 unmarkierten NT* durchf lihren . 

Seouenzanalvse mit 4 markierten NTs*Secruenzanalvse mit • 4 
markierten NTs* 

Bei einer bevorzugten Ausfxihrungsf orm der Erfindung werden 
alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
f arbstof f en markiert . 

Dabei verwendet man eine der oben genannten farbigen 
Kodierungsschemata . Die Zahl der ermittelten NTs fur jede 
Sequenz aus einem Genprodukt liegt zwischen 5 und 100, 
idealerweise zwischen 20 und 50. Diese ermittelten Sequenzen 
werden mit Hilfe eines Programms mit bekannten Sequenzen in 
Gen-Datenbanken verglichen und entsprechenden Genen 
zugeordnet. Einem solchen Programm kann z.B. der BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
computational Biology" 1995 M.S. Waterman Chapman & Hall) . 

Ein Zyklus hat folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) 
und Polymerase zu immobilisierten 
Nukleinsaureketten, 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur 
Verlangerung der komplementaren Strange urn ein NT 
geeignet sind, 

c) Waschen 

d) Detektion der Signale von einzelnen Molekulen 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden und des zur Termination fuhrenden 
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Substituenten, 
f) Waschen. 



Sequenzanalyse mit 2 mar ki er ten NTs* und 2 unmarkierten nt.q 
(2NTb* / 2NTs -Methods) . 

In einer anderen Ausfuhrungsf orm werden fur die Analyse der 

Sequenzen 2 modifizierte NTs* und 2 unmodif izierte NTs einge - 
setzt . 

Diese Ausfiihrungsform beruht auf dera Prinzip, dafi eine 
Abfolge aus 2 Signalen (markierte NT*s) geniigend 
Informationen zur Identif izierung einer Sequenz enthalten 
kann. Die ermittelte Sequenz wird mit der Ref erenzsequenz 
verglichen und einer bestimmten Position zugeordnet, z.B.: 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Ref erenzsequenz 

A-C---C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 
ATCATCGTTCGAAATATCGATCGCCTGATGCC (Ref erenzsequenz ) 

Vorzugsweise wird die ertnittelten Sequenzen mit Hilfe eines 
Programms der Ref erenzsequenz zugeordnet. Einem solchen 
Programm kann z.B. der BLAST oder FASTA Algorithms zugrunde 
liegen ("Introduction to computational Biology" 1995 M.S. 
Waterman Chapman & Hall) . 

Die Genprodukte werden wie oben beschrieben zur Sequenzierung 
vorbereitet und rait 2NTs*/2NTs-Methode sequenziert. Man 
erhalt Sequenzenabschnitte aus Genprodukten, wobei jede 
Sequenz eine Abfolge aus 2NTs* darstellt. Bekannte 
Gensequenzen dienen als Ref erenzsequenzen. Urn eine eindeutige 
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Zuordnung der ermittelten Sequenz zu einer bekannten 
Ref erenzsequenz zu ermoglichen, muS diese Abfolge lang genug 
sein. Vorzugsweise betragt die Lange der ermittelten 
Sequenzen mehr als 20 NT*s . Da 2 markierte NTs* nur einen Teil 
der Sequenz darstellen, ist die Gesamtlange des 
synthetisierten komplementaren Strangs ca. doppelt so lang, 
wie die Abfolge der detektierten NTs* (bei 20 detektierten 
NTs* betragt die Gesamtlange z.B. durchschnittlich 40 NTs) . 

Zur Synthese eines komplementaren Stranges werden 4 
Nukleotide benotigt. Da die mit einem Fluoreszenzf arbstof f 
markierten NTs* in der vorliegenden Erfindung als 
Semiterminatoren auftreten, d.h. die Termination 
ausschlieSlich bei Verfugbarkeit modif izierter NTs* auftritt, 
nriissen unmodif izierte NTs in einem zusatzlichen Schritt in 
jedem Zyklus in die Reaktion zugegeben werden. Die genaue 
Position dieses Schrittes in dem Zyklus kann variieren. 
Wichtig dabei ist, dafi die markierten NTs* und die 
unmodif izierte NTs getrennt verwendet werden. 

Ein Zyklus bei dieser Ausf vihrungsf orm kann beispielhaft 
f olgendermaSen aussehen : 

a) Zugabe einer. Losung mit modif izierten NTs* und 
Polymerasen auf die Oberflache mit den 
bereitgestellten Genprodukten 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur 
Verlangerung der komplementaren Strange urn ein NT 
geeignet sind, 

c) Waschen 

d) Detektion der Signale von einzelnen, modif izierten und 
in die den Genprodukten komplementaren 
neusynthetisierten Strangen eingebauten NTs*-Molekulen 

e) Entfernung der Markierung und der terminierenden 
Gruppe bei den eingebauten Nukleotiden 

f) Waschen 
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g) Zugabe von 2 unmodif izierten NTs und Polymerasen 

h) Waschen. 

Die Konzentration der NTs liegt vorzugsweise unter 1 mM, 
idealerweise unter 10 |iM. 

Beispiel 4 : 

Eine besondere Ausfuhrungsf orm des Verfahrens stellt die 
Analyse von Einzelnukleotidpolymorphismen mit 

sequenzspezif ischen Primern dar. 

Zusatzlich zu Abschnitt 1 "Abkiirzungen und 

Begrif f serlauterungen" werden fur dieses Beispiel folgende 
Begriffe definiert: 

Primer - Zur Verdeutlichung des erf inderischen Gedankens 
werden in diesem Beispiel folgende Begriffe unterschieden : 

a) Onter einem JgPrimer^ wird vorliegend allgemein eine 
Population von Primermolekulen mit einheitlicher 
Struktur verstanden. 

b) ^mehrere Primer^ o.a. werden im Text als mehrere 
Populationen von Primermolekulen verstanden, die 
unterschiedliche Struktur besitzen. 

c) Ein gPrimer-Molekiil$ bedeutet ein einziges 
Oligonukleotid-Molekul . 

d) ^Mehrere Primer-Molekule§ bedeuten mehrere einzelne 
Oligonukleotid-Molekule; sie konnen einheitliche oder 
unterschiedliche Struktur aufweisen. 

SNP-Stelle - eine Position in NSK, die auf Vorhandensein oder 
Abwesenheit von SNP untersucht wird. 

Zielsequenz - Teil einer Gesamtsequenz, der durch die 
Verwendung eines spezifischen Primers in der 

Sequenzierungsreaktion sequenziert/ bestimmt wird. Eine 
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Gesamtsequenz kann mehrere Zielsequenzen enthalten. Eine 
Zielsequenz ist genugend lang, um eine Positionierung dieser 
Zielsequenz innerhalb der Gesamtsequenz mit groSer 
Wahrscheinlichkeit zu gewahrleisten. Zielsequenzen konnen 
beispielsweise eine oder mehrere SNP-Stellen enthalten. 

Erkennungssequenz - Teil der Zielsequenz, der fur die 
Zuordnung dieser Zielsequenz in der Gesamtsequenz verwendet 
wird. 

■ 

In dieser Ausfuhrungsf orm zur SNP-Analyse werden mehrere 
potent ielle SNP-Positionen in der Ref erenzsequenz ausgewahlt, 
die in einer zu analysierenden NSK untersucht werden. Zu 
diesen Positionen werden entsprechend unterschiedliche, 
sequenzspezif ische Primer bereitgestellt . Diese Primer konnen 
einen standardisierten Primersatz zur SNP-Analyse bei einer 
bestimmten Fragestellung bilden und einheitlich als Kit fur 
die betreffende Analysen eingesetzt werden. 

Die Vorbereitung des zu analysierenden Materials (auf SNP zu 
untersuchende einzel- und doppelstrangige Nukleinsaureketten) 
hat erf indungsgemaS das Ziel, aus einer oder mehreren langen 
Nukleinsaureketten (Gesamtsequenz) eine Population an relativ 
kleinen, zwischen 30 ■ und 2000 NT langen, einzelstrangigen 
Nukleinsaurekettenfragmenten (NSKFs) zu bilden. 

Diese NSKF-Molekule werden zufallig auf einer planen 
Oberflache mit einer Dichte zwischen 10 und 1.000.000 pro 100 
jim 2 , vorzugsweise 10 und 100 NSKFs pro 100 pm 2 , 100 bis 10.000 
pro 100 /an 2 oder 10.000 bis 1.000.000 pro 100/xm 2 immobilisiert . 
An die auf der Oberflache gebundenen NSKFs werden Primer 
hybridisiert, so dass die Dichte der extensionsf ahigen NSKF- 
Primer-Komplexe ca. 10-100 pro 100/xm 2 betragt. Nach der 
Hybridisierung werden nicht gebundene Primer entfernt und die 
Sequenzierungsreaktion gestartet. 

» 

Durch eine Auswahl der Zielsequenzen und der 
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sequenzspezif ischen Primer werden nur die relevanten 
Abschnitte der Gesamtsequenz untersucht, was die Menge nicht 
relevanter Inf ormationen verringert und die Analysezeit 
verkurzt . 

Dieser Ausfuhrungsf orm des Verfahrens zur SNP-Analyse liegen 
folgende Prinzipien zugrunde: 

Es werden Stellen in einer Ref erenzsequenz ausgewahlt, 
die in den zu untersuchenden NSKs (Gesamtsequenz) auf 
Einzelnukleotidpolymorphismen (SNPs) uberpruft werden 
sollen. 

1) Zur Analyse jeder ausgewahlten SNP-Stelle werden 
spezifische Primer bereitgestellt , so dass jede zu 
untersuchende SNP-Stelle entweder die nachste Position 
in 3^-Richtung vom Primer einnimmt oder innerhalb von 2 
bis 100 , vorzugsweise 2 bis 50, idealerweise 2 bis 20 
Positionen in 3^-Richtung vom Primer liegt. Die SNP- 
Stelle liegt somit innerhalb der Zielsequenz, die 
wahrend der Sequenzierungsreaktion bestimmt wird. Es 
werden vorzugsweise mehrere SNP-Stellen gleichzeitig 
analysiert, so dass mehrere spezifische Primer verwendet 
werden mussen. . Die Primer werden vorzugsweise so 
ausgewahlt, dass sie moglichst einheitliche Annealing- 
Temperaturen haben, d.h. Unterschiede zwischen 
Schmelztemperaturen einzelner Primerpopulationen liegen 
beispielsweise innerhalb eines Bereichs von ca. 4 Grad, 
besser innerhalb von 2 Grad, noch besser innerhalb von 1 
Grad. 

2) Von der Gesamtsequenz werden kurze 
Nukleinsaurekettenfragmente (NSKFs) abgeleitet, wobei 
diese Fragmente einzelstrangig sind und eine Lange von 
20 bis 2000 NT, vorzugsweise 30 bis 500 NT besitzen. 

3) NSKF-Molekule werden in einer zufalligen Anordnung auf 
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der Oberflache immobilisiert . 



4) Nach der Hybridisierung (Annealing) von 
sequenzspezif ischen Primern an die auf der ■ Oberflache 
immobilisierten NSKFs wird eine zyklische 
Sequenzierungsreaktion durchgef flhrt , wobei fur jedes an 
der Reaktion beteiligte NSKF-Molekul eine Zielsequenz 
ermittelt wird. Die Sequenzierungsreaktion lauft an 
vielen Molekulen gleichzeitig ab. 

5) Die ermittelten Zielsequenzen enthalten Information iiber 
die Zugehorigkeit zu einem bestimmten Abschnitt in der 
Gesamtsequenz und uber den SNP in diesem Abschnitt bei 
der zu untersuchenden Probe. Die Lange der Zielsequenzen 
und somit die Zahl der Zyklen ist so zu wahlen, dass 
eine Identif izierung der Sequenzen gewahrleistet werden 
kann . 



In einer vorteilhaf ten Aus fuhrungs form werden die 
ermittelten Zielsequenzen mit der Ref erenzsequenz 
verglichen und durch Sequenzubereinstimmung zugeordnet . 
Bei einer geniigend langen ermittelten Zielsequenz kann 
man sie mit groSer Wahrscheinlichkeit zu einer 
bestimmten Position in der Ref erenzsequenz zuordnen. 
Beispielsweise kann eine Sequenz aus 10 NTs mehr als 10 6 
verschiedene Kombinationen bilden und somit mit einer 
grofien Wahrscheinlichkeit in einer NSK von nur 100.000 
NT eindeutig identif iziert werden. Nach der Zuordnung 
der ermittelten Zielsequenz zur bestimmten Position 
innerhalb der Ref erenzsequenz werden Unterschiede in den 
Sequenzen, die SNPs, sichtbar. 



Zur Identif izierung der Zielsequenzen wird in einer 
anderen vorteilhaf ten Aus fuhrungs form sowohl die bereits 
bekannte Anzahl der Primer, ihre Zusammensetzung und ein 
bereits bekannter, an die Primerbindungsstelle 
anschlieSender Sequenzabschnitt der Ref erenzsequenz 
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verwendet. Dabei werden die ermittelten Zielsequenzen 
nach ihrer Zugehorigkeit zu den Primern analysiert, 
wobei nur die nah an der Primerbindungsstelle liegenden 
Sequenzen berucksichtigt werden miissen. Wenn 
beispielsweise nur 1000 Primer verwendet werden, reichen 
weniger als 10 NTs der ermittelten Zielsequenzen, urn 
eine Zuordnung zu den entsprechenden Primern zu 
ermoglichen . 

Die zu analysierende Probe enthalt meistens mehrere 
identische Gesamtsequenzmolekule, z.B. mehrere Kopien von 
genomischer DNA aus Zellen eines Gewebes oder mehrere 
identische mRNA-Populationen aus Zellen eines Gewebes. 

a) Wahl der SNP-S telle 

Mit der erf indungsgemafien Methode kann man sowohl bekannte 
SNP-Stellen analysieren als auch neue SNP-Stellen ermitteln. 
Als potentielle SNP-Stelle kann jede Position in der NSK 
auftreten. Die Auswahl richtet sich nach der Fragestellung, 
z.B. SNP-Analyse in Genen, deren Produkte mit bestimmten 
Krankheiten assoziiert sind, oder SNP-Analyse in 
konservierten, kodierenden Abschnitten der Gene, die fur 
Membranrezeptoren kodieren, oder Uberpriifung bekannter SNP- 
Stellen in regulatorischen Sequenzen von Genen, die fur die 
Zellteilung wichtig sind. 

Eine zu analysierende SNP-Stelle liegt innerhalb einer 
Zielsequenz, die wahrend der Sequenzierungsreaktion bestimmt 
wird. Man kann mehrere SNP-Stellen innerhalb einer Zielsequenz 
ermitteln. Man kann andererseits auch mehrere Zielsequenzen 
z.B. innerhalb eines Gens wahlen. Wichtig dabei ist, dass die 
Zielsequenzen in genugendem Abstand voneinander in der 
Gesamtsequenz liegen. Dieser Abstand ist notwendig, damit nur 
ein sequenzspezif ischer Primer pro NSKF hybridisiert , und er 
ist von der durchschnittlichen NSKF-Lange abhangig: je kurzer 
die NSKFs, desto naher aneinander konnen Zielsequenzen liegen. 
Die SNP-Stellen konnen bei angemessener Primer-Wahl an beiden 
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Strangen einer doppelstrangigen Nukleinsaurekette analysiert 
werden . 

Das Verfahren bietet auch die Moglichkeit, beispielsweise 
mehrere SNP-Stellen aus vielen Individuen (als Stichprobe 
einer Population) gleichzeitig zu kontrollieren . Dadurch kann 
z.B. das SNP-Profil einer Population untersucht werden. 

b) Primer fur die Sequenzierungsreaktion 

Sequenzierungsreaktion an einem einzelnen NSKF-Molekul wird 
durch ein Primer-Molekiil ermoglicht. Ein sequenzspezif ischer 
Primer ist erf indungsgemaS notwendig, urn die 
Sequenzierungsreaktion jeweils an einer bestimmten / 
spezifischen Zielsequenz innerhalb der Gesamtsequenz 
durchfuhren zu kormen. Der fur die Analyse einer SNP-Stelle, 
bzw. einer Zielsequenz einzusetzende sequenzspezif ische 
Primer stellt eine Population von Primer -Molekulen mit 
identischer Struktur dar. Fur die Analyse mehrerer, 
unterschiedlicher Zielsequenzen sind mehrere unterschiedliche 
Primer- Populationen notwendig. 

Durch die Verwendung sequenzspezif ischer Primer werden nur 
die relevanten Sequenzabschnitte , die Zielsequenzen, 
analysiert. Im erf indungsgemafien Verfahren wird die zu 
sequenzierende Lange der Sequenzen moglichst niedrig 
gehalten, damit die Geschwindigkeit der Analyse steigt. 

Ein sequenzspezif ischer Primer bindet an eine fur ihn 
spezifische Primerbindungss telle in der zu analysierenden 
Sequenz, PBS. Die Zusammensetzung und die Lange der Primer 
werden fiir jede potentielle SNP-Stelle, bzw. Zielsequenz, 
optimiert. Beispiele fur Optimierungsschritte sind in Rychlik 
et al. NAR 1990 v. 18 S.6409 dargestellt. Bei der Primerwahl 
bzw. bei der Wahl der PBS (Primerbindungsstelle) sind 
folgende Aspekte besonders zu berucksichtigen: 

1) Die zu analysierende SNP-Stelle sollte entweder gleich 
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nach dem 3 1 -Ende des Primers oder innerhalb der nachsten 2 
bis 50 NTs, vorzugsweise 2 bis 20 NTs liegen . 

2) Die Positionierung (die Wahl der Sequenzlange und der 
Zusammensetzung) der PBS zu SNP-Stelle sollte so erfolgen, 
dass die verschiedenen PBS-Sequenzen und die 
korrespondierenden Primer- Sequenzen moglichst ahnliche 
^Annealing-Temperaturen^ besitzen, um bei moglichst 
einheitlichen Hybridisierungsbedingungen zu binden. Das 
kann beispielsweise durch Veranderung der PBS- Position im 
Bezug auf die jeweilige, zu analysierende SNP-Stelle oder 
durch die Veranderung der Primersequenzlange erfolgen 
(Rychlik et al. NAR 1990 v. 18 S.6409). 

3) Der minimale Abstand zwischen Primern, die an denselben 
Strang in der Gesamtsequenz binden, sollte die 
durchschnittliche NSKF-Lange nicht unterschreiten . 

Es kormen Primer fur beide Strange einer Doppelstrang-NSK 
verwendet werden. Damit lassen sich beispielsweise nah 
aneinander liegende SNP-Stellen erfassen, oder man kann eine 
Kontrolle einer SNP-Stelle in beiden Strangen vornehmen . 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 10-30 oder 30-40 oder 40-50. 
Fur verschiedene SNP-Stellen, bzw. Zielsequenzen kormen 
Primer mit unterschiedlicher Lange eingesetzt werden . 

Fur die SNP-Analyse mit sequenzspezif ischen Primern werden 

Primer erf indungsgemafi in einer Hybridisierungslosung an die 

auf der Reaktionsoberf lache immobilisierten NSKFs 
hybridisiert (Annealing-Reaktion) . 

c) Immobilisiezvng von NSKFs 

In dieser Ausfuhrungform werden erf indungsgemafi die NSKF- 
Primer-Komplexe ausschliefilich uber die NSKFs an die 
Oberf lache gebunden (direkte Bindung von NSKFs an die 
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Oberflache) , wobei die bereitgestellten NSKF-Molekule an die 
plane Oberflache in zufalliger Anordnung gebunden werden. 

Die Imrnobilisierung der NSKFs erfolgt vorzugsweise an einem 
der beiden Ketten-Enden (s.o.). Die Imrnobilisierung kann auch 
durch eine unspezif ische Bindung, wie z.B. durch Austrocknung 
der NSKFs enthaltenden Probe auf der planen Oberflache 
erreicht werden. Die Dichte der Immobilisation kann zwischen 
10 und 100, 100 und 10.000, 10.000 und 1.000.000 NSKFs pro 
100 ixm 2 liegen. 

d) Hybridisierung 

Die gebundenen NSKFs und die Primer werden unter stringenten 
Hybridisierungsbedingungen inkubiert, die eine moglichst 
selektive Anbindung (Annealing) der Primer an die 
entsprechenden Primerbindungsstellen der NSKFs erlauben. 
Optimale Hybridisierungsbedingungen hangen von der genauen 
Struktur der Primerbindungsstellen und der jeweiligen 
Primerstrukturen ab und lassen sich beispielsweise nach 
Rychlik et al . NAR 1990 v. 18 S.6409 berechnen. 

Die Primer stellen vorzugsweise ein Primergemisch dar. Die 
Konzentrationen einzelner sequenzspezif ischer Primer 
(Einzelkonzentrationen von Primer- Populationen) liegen 
beispielsweise zwischen 10pmol/l und lmmol/1, vorzugsweise 
zwischen 0.1/xmol/l und 10jxmol/l. Die Gesamtkonzentration von 
Primern im Primergemisch liegt vorzugsweise zwischen lnmol/1 
und 10mmol/l . Das Verhaltnis zwischen einzelnen Primer- 
Populationen kann variieren. Primer konnen in deutlichem 
Uberschuss liber die immobilisierten NSKFs zugegeben werden, so 
dass die Hybridisierungszeit gering ist. 

Die fur die Detektion notwendige Dichte von extensionsf ahigen • 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 /xm 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer 
erreicht werden. 
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Bei einer bekannten NSKF-Konzentration konnen in einer 
Ausfiihrungsform die Immobilisierungsbedingungen so gewahlt 
werden, dass die NSKFs in einer Dichte von ca. 10 bis 1000 
Molekiile pro 100/un 2 gebunden werden. . NSKFs bestimmen somit 
die Dichte der NSKF-Primer-Komplexe. 

In einer anderen Ausfiihrungsform kann die Dichte der 
immobilisierten NSKFs wesentlich hoher als 10 0 0 NSKFs pro 
100/im 2 liegen, z.B. 1.000.000 pro 100/zm 2 . Die fur die optische 
Detektion notwendige Dichte der NSKF-Primer-Komplexe wird 
wahrend der Primer-Hybridisierung erreicht. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer) so 
zu wahlen, dass die Primer nur an einen Teil der 
immobilisierten NSKFs binden. 

Bei unbekannter NSKF-Konzentration und entsprechend 
unbekannter Immobilisationsdichte kann die Hybridisierung 
(Annealing) von Primern an die NSKFs zu einer hoheren als 
optimale Dichte von NSKF-Primer-Komplexen fiihren. 

Aus diesem Grund wird in einer vorteilhaf ten Ausfiihrungsform 
ein Teil der NSKFs enthaltenden Probe fur die Ermittlung der 
optimalen Dichte verwendet. Dieser Teil wird auf einer 
Reaktionsoberf lache immobilisiert , die Primer werden an die 
NSKFs hybridisiert und die entstandenen NSKF- Primer -Komplexe 
werden durch den Einbau von Fluoreszenzf arbstof f tragenden 
NT*s (z.B. Cy3-dCTP, Amersham Pharmacia Biotech) markiert. 
Aus der ermittelten Dichte lasst sich einerseits die 
eventuell notwendige Verdunnung oder Konzentrierung der 
urspriinglichen Probe fur den endgiiltigen Sequenzierungsansatz 
errechnen (Die Hybridisierungsbedingungen werden 

beibehalten) . Andererseits konnen daraus notwendige 
Veranderungen in den Hybridisierungsbedingungen errechnet 
werden, beispielsweise eine Verkurzung der 

Hybridisierungszeit, wobei die NSKF-Immobilisierungsdichte 
konstant bleibt. 
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Das Mengen-Verhaltnis zwischen Primerpopulationen kann 
unterschiedlich oder gleich grofi sein. Durch eine hohere 
Primerkonzentrationen konnen gewisse , beispielsweise 
seltenere Sequenzen mit grofierer Wahrscheinlichkeit in einem 
bestimmten Zeitraum gebunden werden. 

Der groSe Vorteil der beschriebenen Verf ahrensanordnung 
gegenuber einer Verf ahrensanordnung mit auf einer Oberflache 
immobilisierten sequenzspezif ischen Primern und einer 
anschlieSenden Hybridisierung von Proben an diese Primer ist 
die deutliche Verkurzung der Zeit fur die Hybridisierung 
(Annealing) zwischen den sequenzspezif ischen Primern und den 
zu analysierenden Proben auf der Reaktionsoberf lache, 

Legenden zu Figuren 1 bis 8 
Legende zu Fig* 1 

Schematische Darstellung der Sequenziemg einer langen 
Nukleinsaurekette 

Der Sequenzierung und der Rekonstruktion von langen 
Nukleinsauresequenzen . (NSKs) liegt das Shotgun- Prinzip 
zugrunde. Die Sequenz eines langen DNA-Stucks wird dabei durch 
die Sequenzierung kleiner Fragmente (NSKFs) und eine 
nachfolgende Rekonstruktion ermittelt . 

1) Ausgangsmaterial - die zu analysierende lange 
Nukleinsaurensequenz , Gesamtsequenz 

2) Fragmente von 50-1000 bp - die im Fragment ierungsschritt 
aus der Gesamtsequenz erzeugten NSKFs 

3) Fragmente mit jeweils einem Primer - NSKF-Primer-Komplexe 

4) Immobilisierte Fragmente - an die plane Oberflache 



WO 03/020968 



87 



PCT/EP02/09614 



gebundene NSKF-Primer-Komplexe, in dieser Ausfuhrungsf orm 
erfolgt die Bindung am 3 V -Ende der NSKFs 

5) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

6) Waschschritt - nach dem Einbauschritt wird die Oberflache 
gewaschen 

7) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

8) Entfernung der Markierung und der zur Termination fiihrenden 
Gruppe 

Legende zur Fig- 2 

Beispiele fur allgemeine Struktur von NSKF-Primer-Komplexen 

In dieser Ausf uhrungsf orm wird eine einheitliche 
Primerbindungsstelle (PBS) an das 3'-Ende der NSKFs 
angekoppelt und an diese PBS bindet ein einheitlicher Primer. 

Legende zur Fig. 3 

Ein Beispiel fur die Ankopplung einer einheitlichen 
Primerbindungsstelle (PBS) , die eine funktionelle Gruppe zur 
Bindung an die Oberflache tragt. 

In diesem Fall wird ein doppelstrangiger 

Oligonukleotidkomplex (3a), der beispielsweise eine 
Modifikation an beiden Strangen hat (3b) , an die 
doppelstrangigen NSKFs liegiert (3c) . Nach Denaturierung 
entstehen einzelstrangige NSKFs mit einheitlicher PBS (3d) . 



WO 03/020968 



88 



PCT/EP02/09614 



Legende zur Fig. 4 

Ein anderes Beispiel fur die Erzeugung einer einheit lichen 
Primerbindungsstelle (PBS) . 

In diesem Fall werden NTs an das 3'-Ende der einzelstrangigen 
NSKFs angekoppelt (ein so genanntes „Tailing") . Durch 
Verwendng eines einheitlichen NT entsteht eine einheitliche 
PBS. 

Legende zur Fig. 5 

Beispiel fur die Bindung von NSKFs an eine gelartige 
Reaktionsoberf lache . 

Auf einer festen Unterlage (1) haftet eine Gelschicht (2), 
z.B. ein Polyacrylamidgel (Fig. 5a), oder haften viele 
Gelkugelchen (5), z.B. Agarosekugelchen (Fig. 5b). An die 
Oberf lache des Gels sind NSKFs (4) gebunden. Die NSKFs tragen 
eine funktionelle Gruppe, z.B. Biotin, und sind an das Gel 
uber Streptavidin oder Avidin (3) gebunden. 

V 

Legende zur Fig. 6 

Beispiel fur eine Durchf lussvorrichtung 

Eine gelartige Reaktionsoberf lache (1) ist auf einer fur das 
Anregungs- und Fluoreszenzlicht durchlassige festen Unterlage 
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. 
Die Flussigkeiten in der Flow-Cell kdnnen kontrolliert 
ausgetauscht werden, wobei die Flow-Cell zusammen mit 
Vorratsbehalter (3), Pumpe (4) und Ventil (5) eine 
Durchf lussvorrichtung bilden. Auf der Reaktionsoberf lache 
sind NSKF-Primer-Komplexe gebunden (hier nicht abgebildet) . 
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Die Signale der eingebauten NT*s werden mit der 
Detektionsapparatur (6) detektiert . 



Legende zur Fig. 7 

Schematische Darstellung der Analyse von mRNA- Population 

Der Analyse liegt die Sequenzierung kurzer Abschnitte von mRNA 
zugrunde . 

1) mRNA - die zu analysierende mRNA- Population, in diesem 
Beispiel bestehend aus zwei unterschiedlichen mRNA- 
Molekulpopulationen (dunne und dicke Streifen reprasentieren 
mRNA-Molekule) 

2) Immobilisierte mRNA - an die plane Oberflache gebundene 
mRNA-Primer-Komplexe, in diesem Beispiel erfolgt die Bindung 
durch die 01 igo-dT- Primer 

3) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

4) Waschschritt - nach dem Einbauschritt wird die Oberflache 
gewaschen 

5) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

6) Entfernung der Markierung und der zur Termination 
f uhrenden Gruppe 

Legende zur Fig. 8 

Beispiel fur ein Detektions system 

Dargestellt ist ein Weitfeld-Optik-Detektionssystem. Nach dem 
Einbau von markierten NT*s wird die Oberflache (7) 
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abgescannt, wobei die Fluoreszenzsignale von einzelnen, an 
die NTs gekoppelten Farbstof fmolekiilen detektiert werden. 

Fig. 8a Schematische Darstellung eines Abschnittes der 
Reaktionsoberf lache (grau) , der abgescannt wird. Die Kreise 
entsprechen jeweils der Aufnahme eines 2D-Bildes und 
reprasentieren die Flachen, von denen die Fluoreszenzsignale 
detektiert werden. Dabei werden pro Aufnahme mehrere Signale 
(beispielsweise 100 bis 10.000) von einzelnen Molekiilen 
gleichzeitig registriert. Die Reaktionsoberf lache wird in 
jedem Zyklus abgescannt, wobei wahrend des Scannvorganges 
mehrere Aufnahmen von unterschiedlichen Stellen der 
Oberf lache gemacht werden. Dabei konnen bis zu mehreren 
Millionen Signale von eingebauten NT*s aufgenommen werden. 
Die hohe Parallelitat ist die Grundlage fur die 
Geschwindigkeit des Verfahrens. 

Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von 
einzelnen, eingebauten NT*s. 

Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt 
Signale von vier eingebauten NT*s. Jedes Signal besitzt 
charakteristische Eigenschaf ten der Einzelmolekulsignale (s. 
Beschreibung) und kann auf grund dieser identif iziert werden 
(vorzugsweise mit Hilfe eines Computer-Programms ) . Jedem der 
identif izierten Signale werden die entsprechenden X,Y- 
Koordinaten zugeordnet . 
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Patentanspriiche ; 

Verfahren zur parallelen Sequenz analyse von 
Nukleinsauresequenzen (Nukleinsaureketten, NSKs) , bei dem 
man 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer Lange 
von etwa 50 bis 1000 Nukleotiden erzeugt, die uberlappende 
Teilsequenzen einer Gesamtsequenz darstellen konnen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von NSKF-Primer- 
Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
durchfiihrt, indem man 

a) zu den auf der Oberflache gebundenen NSKF-Primer- 
Koraplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs") enthalt, die mit Fluoreszenzf arbstof f en 
markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstof fe so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs* an der 3 1 - 
Position strukturell so modifiziert sind, daS die 
Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in denselben Strang ein- 
zubauen, wobei der zur Termination fuhrende 
Substituent und der Fluoreszenzf arbstof f abspaltbar 
ist, man 
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b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn eiri NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfemung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzf arbstof f charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fuhrenden Substituenten und die 
Fluoreszenzfarbstof f e von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzfarbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lache und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in auf einanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs be- 
stimmt . 
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Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils 
ein markiertes NT* einsetzt. 

Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
zwei unterschiedlich markierte NTs* einsetzt . 

Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
vier unterschiedlich markierte NTs* einsetzt. 

Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die NSKs Varianten einer bekannten Ref erenzsequenz sind 
und man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in den Zyklen abwechselnd 
jeweils zwei unterschiedlich markierte NTs* und zwei 
unmarkierte NTs einsetzt und man die Gesamtsequenzen durch 
Vergleich mit der Ref erenzsequenz ermittelt. 

Verfahren nach den Anspruchen 1 bis 5, dadurch gekenn- 
zeichnet, dass man in die NSKFs jeweils eine Primerbin- 
dungsstelle (PBS) einfuhrt, wobei man bei doppelstrangigen 
NSKs an beiden komplementaren Einzelstrangen jeweils eine 
PBS einfuhrt und wobei die Primerbindungsstellen fur alle 
NSKFs jeweils gleiche oder verschiedene Sequenzen 
aufweisen. 

Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs mit Primern in einer Losung 
unter Bedingungen in Kontakt bringt, die zur Hybridisie- 
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rung der Primer an .die Primerbindungsstellen (PBSs) der 
NSKFs geeignet sind, wobei die Primer untereinander 
gleiche oder verschiedene Sequenzen aufweisen, und man die 
gebildeten NSKF-Primer-Komplexe anschlieSend auf der Reak- 
tionsoberf lache bindet . 

Verfahren nach den Anspriichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs zunachst auf der Reaktions- 
oberflache immobilisiert und erst anschlieSend mit Primern 
unter Bedingungen in Kontakt bringt, die zur Hybridisie- 
rung der Primer an die Primerbindungsstellen (PBSs) der 
NSKFs geeignet sind, wobei NSKF-Primer-Komplexe gebildet 
werden, wobei die Primer untereinander gleiche oder ver- 
schiedene Sequenzen aufweisen. 

Verfahren nach den Anspriichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der 
Reaktionsoberflache immobilisiert und erst anschlieSend 
mit NSKFs unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der NSKFs geeignet sind, wodurch NSKFs an die 
Obeirf lache gebunden und NSKF-Primer-Komplexe gebildet 
werden, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen. 



10. Verfahren nach den Anspriichen 1 bis 9, dadurch 

gekennzeichnet , dass die Dichte der extensionsfahigen 

NSKF-Primer-Komplexe zwischen etwa 10 und 100 pro 100/xm 2 
liegt . 



. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die Nukleinsauresequenzen (NSKs) Sequenzabschnitte einer 
Gesamtsequenz sind und die Primer sequenzspezif ische 
Primer sind, wobei man 
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einzelstrangige NSKFs mit einer Lange von etwa 30 bis 
1000 Nukleotiden bereitstellt , die uberlappenden 
Teilsequenzen der Gesamtsequenz entsprechen, man 

die NSKF-Molekule direkt an einer planen Oberflache in 
einer zufalligen Anordnung bindet, man 

* 

mit einer oder mehreren sequenzspezif ischen 
Primerpopulationen eine Hybridisierung (Annealing) an die 
immobilisierten NSKFs durchfuhrt, wobei die Dichte der 
einzelnen extensions fahigen NSKF-Primer-Komplexe zwischen 
10 und 100 pro lOO^m 2 liegt, man 

eine zyklische Auf baureaktion der zu NSKFs komplementaren 
Strange durchfuhrt, indem man 

a) zu den gebundenen NSKF- Primer- Komplexen eine Losung 
zugibt, die eine oder mehrere Polymerasen und ein bis 
vier modifizierte Nukleotide (NTs*) enthalt, die mit 
Fluoreszenzf arbstof f en markiert sind, wobei die bei 
gleichzeitiger Verwendung von mindestens zwei NTs* 
jeweils an den NTs* befindlichen Fluoreszenzf arb- 
stof fe so gewahlt sind, dafi sich die verwendeten NTs* 
durch Messung unterschiedlicher Fluoreszenzsignale 
voneinander unterscheiden lassen, wobei die NTs* an 
der 3 ■ -Position strukturell so modif iziert sind, daS 
die Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in denselben Strang einzubauen, 
wobei der zur Termination fuhrende Substituent und 
der Fluoreszenzf arbstof f abspaltbar ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 
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c) die in Stufe b) erhaltenen stationaren Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

e) die einzelnen, in komplementare Strange eingebauten 
NT*-Molekule durch Messen des fur den jeweiligen 
Fluoreszenzfarbstoff charakteristischen Signals 
detektiert, wobei man gleichzeitig die relative Posi- 
tion der einzelnen Fluoreszenzsignale auf der 
Reaktionsoberf lache bestimmt, man 

e) die zur Termination fiihrenden Substituenten und die 
Fluoreszenzfarbstof fe von den am komplementaren 
Strang angefiigten NTs* zur Erzeugung unmarkierter 
(NTs oder) NSKFs abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der zu 
Termination fiihrenden Gruppen mit den Fluoreszenz- 
farbstoffen geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lache und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs 
bestimmt . 



12. Verfahren zur hoch parallelen Analyse der Genexpression 
bei dem man 
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einzelstrangige Genprodukte bereitstellt , man 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von Genprodukt- 
Primer-Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der Genprodukte unter Verwendung einer oder mehrerer 
Polymerasen durchfuhrt, indem man 



a) 



zu den auf der Oberf lache gebundenen Genprodukt- 
Primer-Komplexen eine Losung zugibt, die eine oder 
mehrere Polymerasen und ein bis vier modifizierte 
Nukleotide (NTs') enthalt, die mit Fluoreszenzf arb- 
stoffen markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs' befindlichen Fluoreszenzf arbstoffe so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs' an der 3'- 
Position strukturell so modif iziert sind, da£ die 
Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in - denselben Strang ein- 
zubauen, wobei der zur Termination fiihrende 

Substituent und der Fluoreszenzf arbstoff abspaltbar 
ist, man 



b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die kom- 
plementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
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Bedingungen wascht, die zur Entfernung nicht in 
einen komplementaren Strang eingebauter NTs* ge- 
eignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter , (NTs oder) Genprodukte 
die zur Termination fuhrenden Substituenten und die 
Fluoreszenzf arbstof f e von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluores- 
zenzf arbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt- 
Primer-Komplexe auf der Reaktionsoberf lache und die 
Sequenz dieser Genprodukte durch spezifische Zuordnung 
der in Stufe d) in auf einanderf olgenden Zyklen an den 
jeweiligen Positionen detektierten Fluoreszenzsignale zu 
den NTs bestimmt und man aus den ermittelten Teilse- 
quenzen die Identitat der Genprodukte bestimmt. 

13. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus nur 
jeweils ein markiertes NT* einsetzt. 

14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass 
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man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
zwei unterschiedlich markierte NTs* einsetzt. 

15. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
vier unterschiedlich markierte NTs* einsetzt. 

16. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass 
bereits bekannte Gene als Ref erenzsequenzen dienen und 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in den Zyklen abwechselnd 
jeweils zwei unterschiedlich markierte NTs* und zwei 
unmarkierte NTs einsetzt und man die Identitat der 
Genprodukte durch Vergleich der gewonnenen Sequenzen mit 
denen der Ref erenzsequenzen ermittelt. 

17. Verfahren nach den Anspruchen 12 bis 16, dadurch gekenn- 
zeichnet, dass man in die Genprodukte jeweils eine 
Primerbindungss telle (PBS) einfuhrt, wobei die Primer- 
bindungsstellen fur alle Genprodukte jeweils gleiche oder 
verschiedene Sequenzen aufweisen. 

18. Verfahren nach den Anspruchen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Genprodukte mit Primern in einer 
Losung unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei die Primer 
untereinander gleiche oder verschiedene Sequenzen 
aufweisen, und man die gebildeten Genprodukt- Primer - 
Komplexe anschlieSend auf der Reaktionsoberf lache bindet. 

19. Verfahren nach den Anspruchen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Genprodukte zunachst auf der Reak- 
tionsoberf lache immobilisiert und erst anschliefiend mit 
Primern unter Bedingungen in Kontakt bringt, die zur 
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Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei Genprodukt- 
Primer- Komplexe gebildet werden, wobei die Primer 
untereinander gleiche oder verschiedene Sequenzen auf- 
weisen. 

20. Verfahren nach den Anspruchen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der Reaktions- 
oberflache immobilisiert und erst anschlieSend mit Gen- 
produkten unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wodurch Genprodukte 
an die Oberflache gebunden und Genprodukt- Primer -Komplexe 
gebildet werden, wobei die Primer untereinander gleiche 
oder verschiedene Sequenzen auf weisen. 

21. Verfahren nach den Anspruchen 12 bis 20, dadurch 
gekennzeichnet, dass die Dichte der extensionsf ahigen 
Genprodukt -Primer -Komplexe zwischen etwa 10 und 100 pro 
lOO^im 2 liegt. 



22. Verfahren nach Anspruchen 1 bis 21 dadurch gekennzeichnet , 
dass der Fluoreszenzf arbstof f zusammen mit dem zur 
Termination fiihrenden Substituenten abgespalten wird. 

23. Verfahren nach Anspruchen 1 bis 21 dadurch gekennzeichnet, 
dass zunachst der Fluoreszenzf arbstof f abgespalten wird 
und erst danach der zur Termination fuhrende Substituent 
abgespalten wird. 

24. Verfahren nach Anspruchen 1 bis 21, dadurch 
gekennzeichnet, dass man im Detektionsschritt (d) 
folgende Detektionsarten einsetzt: Weitfeld- 
Epif luoreszenzmikroskopie , Laser-Scanning- 
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Fluoreszenzmikroskopie , TIRF-Mikroskopie . 

25. Verfahren nach den Anspruchen 1 oder 11, dadurch 
gekennzeichnet, dass es ein Verfahren zur SNP-Analyse ist 
und man einen sequenzspezif ischen Primer zur 
Identifizierung jeder SNP-Stelle in der Gesamtsequenz 
verwendet . 

26. Verfahren nach Anspruch 25, dadurch gekennzeichnet , dass 
die Zahl der parallel zu analysierenden SNP-Stellen 
groSer als 2 ist und man fur jede SNP-Stelle einen 
sequenzspezif ischen Primer verwendet. 

27. Verfahren nach den Anspruchen 1 bis 26, dadurch gekenn- 
zeichnet, dass die Reaktionsoberf lache aus der Gruppe 
bestehend aus Silicon, Glas, Keramik, Kunststof f en, Gelen 
ausgewahlt ist . 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass 
die Kunststoffe Polycarbonate oder Polystyrole oder 
Derivate derselben sind. 

29. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass 
die Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

30. Verfahren nach Anspruch 29, dadurch gekennzeichnet, dass 
die Gele 1 bis 2 % Agarose-Gele oder 10 bis 15 % 
Polyacrylamid-Gele sind. 

31. Verfahren nach den Anspruchen 1 bis 30, dadurch 
gekennzeichnet, dass die Polymerase eine DNA- Polymerase 
ohne 3 ' -5 ' -Exonukleaseaktivitat ist . 

32. Verfahren nach Anspruch 31, dadurch gekennzeichnet, daS 
die Polymerase aus der Gruppe bestehend aus viralen DNA- 
Polymerasen vom Sequenase-Typ, bakteriellen 
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thermolabilen und thermostabilen DNA-Polymerasen, DNA- 
Polymerasen Beta aus Eukaryonten und Reversen- 
Transkriptasen ausgewahlt ist. 



33. Verfahren nach den Anspruchen 1 bis 32, dadurch 
gekennzeichnet, dass die Fluoreszenzf arbstof f e aus der 
Gruppe bestehend aus Cyanin-Farbstof f en, Rhodamine, 
Xanthene, Porphyrine und deren Derivaten ausgewahlt sind. 

34. Trager zur Durchfuhrung des Verfahrens nach den 
Anspruchen 1 bis 33, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Nukleinsaureketten oder deren 
Fragmente in einer zufalligen Anordnung immobilisiert 
sind, wobei die Dichte der immobilisierten 
Nukleinsaureketten-Molekule oder deren Fragmente zwischen 
10 und 100 pro lOOjxm 2 liegt . 

35. Trager zur Durchfuhrung des Verfahrens nach den 
Anspruchen 1 bis 33, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Nukleinsaureketten oder deren 
Fragmente in einer zufalligen Anordnung immobilisiert 
sind, wobei die Dichte der immobilisierten 
Nukleinsaureketten-Molekule oder deren Fragmente zwischen 
100 und 1.000.000 pro 100/xm 2 liegt. 



36. Kit zur Durchfuhrung des Verfahrens nach den Anspruchen 
1 bis 35, dadurch gekennzeichnet, da£ es eine 
Reaktionsoberflache (einen festen Trager) , zur 
Durchfuhrung des Verfahrens erforderliche Reak- 
tionslosungen, ein oder mehrere Polymerasen, und Nu- 
kleotide (NTs) enthalt, von denen ein bis vier mit Fluo- 
reszenzf arbstof fen markiert sind, wobei die markierten 
NTs ferner strukturell so modifiziert sind (NT* bzw. 
NTs*) , dafi die Polymerase nach Einbau eines solchen NT* in 
einen wachsenden komplementaren Strang nicht in der Lage 
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ist, ein weiteres NT* in denselben Strang einzubauen, 
wobei der zur Termination fuhrende Substituent mit dem 
Fluoreszenzfarbstof f abspaltbar ist 

7. Kit nach Anspruch 36, dadurch gekennzeichnet , da£ es 
ferner Bestandteile enthalt: 



a) zur Erzeugung von Einzelstrangen aus Doppelstrangen 
erforderliche Reagenzien, 

b) Nukleinsauremolekiile, die als PBS in die NSKFs 
eingefiihrt warden, 

c) Oligonukleotid- Primer , 

d) zur Abspaltung der Substituenten mit den Fluores- 
zenzf arbstof f en erforderliche Reagenzien, 

e) Waschlosungen. 



8. Kit nach den Anspruch 3 6 oder 37, dadurch 

gekennzeichnet, daS die Reaktionsoberf lache aus der 

Gruppe bestehend aus Silicon, Glas, Keramik, 
Kunststof f en, Gelen ausgewahlt ist. 



9. Kit nach Anspruch 38, dadurch gekennzeichnet, da£ die 

Gele Polyacrylamidgele sind. 

0. Kit nach Anspruch 39, dadurch gekennzeichnet, da£ die 
Gele 5 bis 30% Polyacrylamid-Gele sind. 

1. Kit nach den Anspriichen 36 bis 40, dadurch gekennzeich- 
net, daS die DNA- Polymerase eine DNA- Polymerase ohne 3 1 - 
5 1 -Endonukleaseaktivitat ist . 



2. Kit nach den Anspriichen 36 bis 41, dadurch gekennzeich- 
net, dafi die an die Nukleotide gekoppelten 
Fluoreszenzfarbstof f e aus der Gruppe bestehend aus Cya- 
nin-Farbstof fen, Rhodamine, Xanthene, Porphyrine und 
deren Derivaten ausgewahlt sind. 
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1) 



Ausgangsmaterial 



2) 



Fragmente 50-1000 bp 



3) 



Fragmente mit jeweils 
einem Primer 



4) 




Immobilisierte Fragmente 



5) 




Zugabe einer Losung mit 
Polymerasen und NTs* 



6) 




Waschschritt 



7) 




Detektion 



8) 




Entfernung der Markierung und 
der zur Tennination fiihrenden 
Gruppe 



Legende: 
feste Oberflache 



Polymerase NT* 




o 



Signal von NT* Mikroskop und 

Beleuchtung 





■ 

1 




1 


1 




1 


1 
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* 

AJlgemeine Struktur fiir immobilisierte Nukleinsaurekettenfragmeiite 

1 • 

5^ 3^ 

2 3 



Legende: 

1) Primer 

2) Primerbindungsstelle 

3) einzelstrangiger Teil des Nukleinsaurekettenfragmeats, stammt vom 
Ausgangsmaterial 
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Fig. 3 



Oligonakleotid-Konstruktion mit einer Primerbindungsstelle und blockierten 
Enden. 

3a) 

Otigonukleotidkomplex 5 V 3" 

37/. H5\ 

Primerbindungsstelle // // 

3b) 

Modification einer Seite des Oligonukleotides an beiden Strangen. Nur ein Ende steht 
fur die Ligation zur Verfugung. 

xxxxx-5 v 3" 

kkk-37/- -//5 s 

Die modifizierenden Gruppen "xxxxx-" und "kkk-" konnen z.B. zur Immobilisation 
oder Markierung dienen. 

3c) 

Resultat der Ligation des Oligonukleotides mit den DNA-Fragmenten 

■ 

xxxxx-y / -// //3 s -kkk 

kkk-3// //- / 5^ -xxxxx 



3d) 

Konstruktion der DNA-Fragmente nach der Denaturierung 



//3^-kkk 
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Fig. 4 

Nukleotid-Tailing 



_ 3 s einzelstrangiges DNA-Fragment 

+ Deoxynucleotidyltransferase 
+ dGTP 

5^ ^ ,__( G ) n 3^ 





Legende: 

1) feste Oberflache 

2) Gel 

3) zur Immobilisation geeignete Gruppem z.B. Avidin oder Streptavidin, oder 
Oligonukleotide 

4) . NSKFs 

5) Agarosekiigelchen 
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4 



0 

7 



YZZZZZZZZZZZZZZZZZZ&Z 



1 




Flussrichtung 



Legende: 

1) Reaktionsoberflache 

2) feste Unterlage 

3) Vorratsbehalter 

4) Pumpe 

5) Ventil 

6) Objektiv des Mikroskops 
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FIG. 7 

mRNA 




Immobilisierte mRNA 



Zugabe einer Losung mh 
Polymerasen und NTs* 



Waschschritt 



Detektion 



Entfernung der Markierung und 
der zur Tennination fiihrenden 
Gruppe 



Legende: 

feste Oberflache Polymerase 
mit oligo-dT-Primern 



NT* 



Signal von NT* 



Mikroskop und 
Beleuchtung 




o 



• 4 



1 




• 


1 




f \ 


' 1 


1 
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Fig. 8 




Legende: 

1) Lichtquelle zur Anregung der Fluoreszenz 

2) Lichtleitender Teil 

3) Scanntisch 

4) Vorrichtung zur Selektion von Spektren 

5) ^ Detektionsvorrichtung 

6) Computer mit Steuerungs- und Analysefiinktionen 

7) Oberflache mit immobilisierten NSKFs 
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STARTING MATERIAL 
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Fragment mit jewab 
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(57) Abstract: The invention relates to a method for analyz- 
ing nucleic acid sequences and gene expression. The method' 
is based on the detection of fluorescence signals of nucleotide 
molecules inserted into growing nucleic acid chains by means of 
a polymerase. The reaction occurs on a plane surface, wherein 
a plurality of individual nucleic acid molecules are immobilized 
on said surface. All said nucleic acid molecules are exposed to 
the same conditions so that a build-up reaction can simultane- 
ously lake place in all nucleic acid molecules. 

(57) Zusammenfassung: Die Erfindung betrifft ein Verfahren 
zur Analyse von NukJeinsaurekettensequenzen und der Genex- 
pression. Grundlage der Methode ist die Detektion von Fluo- 
reszenzsignalen einzelner, mit Farbstoffen markierter Nukleo- 
tidmolekiile, die durch eine Polymerase in wachsende Nukle- 
insaureketten eingebaut werden. Die Reaktion verlauft auf ei- 
ner planen Oberflache. Auf dieser Oberflache sind viele ein- 
zelne Nukleinsaure-Molekule immobilisiert. Aile diese Nuk- 
leinsaure-Molekule sind gleichen Bedingungen ausgesetzt, so 
dass an alien Nukleinsaure-MolekUlen gleichzeitig eine Aufbau- 
reaktion ablaufen kann. 
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This international searchreport has not been established inrespect of certain claims under Article 17 (2) (a) for the following reasons: 
1. I I ClaimsNos.: 

1 — because they relate to subject matter not required to be searched by this Authority, namely: 



2. [XJ ClaimsNos.: 36 and 37 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 

see supplemental sheet PCT/ISA/210 



3. j "I ClaimsNos.: 

— because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6. 4(a). 



Box II Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This International Searching Authority found multiple inventions in this international application, as follows: 



1. j""] As all required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims . 

2. As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 
of any additional fee. 

3 . | | As only some of the required additional search fees were timely paid by the applicant, this international search report 
— covers onlythose claims for which fees were pai4 specm^cally claims Nos.: 



4. I I No required additional search fees were timely paid by the applicant Consequently, this international search report is 
' — ' restricted to the invention first mentioned in the claims; it is covered by claims Nos. : 



Remark on Protest The additional search fees were accompanied by the applicants protest 

| | No protest accompanied the payment of additional search fees. 
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International application No. 
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Box 1.2 

Claims 36 and 37 (in part) 

The current Claims 36 and 37 relate to products, each of which is characterised by a 
desirable characteristic or property, namely: 

- Reaction solutions for carrying out the process (Claim 36); 

- Chain-terminating nucleotides, the terminating substituent of which can be separated 
by the fluorescent dye (Claim 36); 

- Reagents for producing single strands (Claim 37); 

- Reagents for separating the substituents using the fluorescent dyes (Claim 37). 

The claims thus encompass all products that have this characteristic or property, and yet 
the application provides support in the description (PCT Article 6) for only a limited 
number of such products. In the present case the claims lack the proper support and the 
application lacks the requisite disclosure to such an extent that it appears impossible to 
carry out a meaningful search covering the entire range of protection sought. Moreover, 
the claims also lack the requisite clarity (PCT Article 6) since they attempt to define the 
products in terms of the desired results. This lack of clarity too is such that it is 
impossible to carry out a meaningful search covering the entire scope of protection 
sought. 

The search was therefore directed to the parts of the claims that appear to be clear, 
supported and disclosed in the above sense, namely the parts relating to: 

- Chain-terminating nucleotides bearing a termination substituent and a fluorescent 
dye in the 3 -position on the (deoxy)ribose; 

- Reagents for alkali denaturing 

- Reagents for separating the substituents, as described in the passage from page 36, 
line 30 to page 38, line 19. 

The reaction solutions are not clearly defined and were not searched. 

The applicant is advised that claims or parts of claims relating to inventions in respect of 
which no international search report has been established cannot normally be the subject 
of an international preliminary examination (PCT Rule 66.1(e)). In its capacity as 
International Preliminary Examining Authority the EPO generally will not carry out a 
preliminary examination for subjects that have not been searched. This also applies to 
cases where the claims were amended after receipt of the international search report (PCT 
Article 19) or where the applicant submits new claims in the course of the procedure 
under PCT Chapter II. 
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A. KLASSIFI2IERUNG DES ANMELDUNGSGEGENST ANDES 

IPK 7 C12Q1/68 B01J19/00 



Inte J kanates Aktenzeichen 

PCT/EP 02/09614 



Nach der Intemationalen Patenlktassifikation (IPK) Oder nach der natenaten Kiassifikation und der IPK 
B. RECKERCHIERTE GEBIETE 



Recherchierter MindestprutetoH (Klassiflkationssystem und Klassifikationssymbole ) 

IPK 7 C12Q 



Recherchierte aber nichi 2um Mindestprufstoti gehdrende VerOflentlichungen, soweit diese unter die recherchierten Gebiete fallen 



Wahrend der intemationalen Recherche konsultterte elektronische Datenbank (Name der Datenbank und evtl. verwendete Suchbegriffe) 

EPO-Internal , EMBASE, MEDLINE, BIOSIS, PAJ, WPI Data 



C. ALS WESENTLICH ANGESEHENE UNTER LAGEN 



Kategorie 0 



Bezeichnung der Veroffentiichung, soweit erlofderiich unter Angabe der in Betracht kommenden Teile 



Betr. Anspruch Nr. 



WO 00 06770 A (BALASUBRAMANIAN SHANK AR 
;KLENERMAN DAVID (GB); SOLEXA LTD (GB)) 
10. Februar 2000 (2000-02-10) 
Seite 5, Zelle 22 -Seite 10, Zeile 2 
Anspruche 1,6-8,14,22,24,25 

WO 93 21340 A (MEDICAL RES COUNCIL 
; BRENNER SYDNEY (GB); ROSENTHAL ANDRE 
(GB)) 28. Oktober 1993 (1993-10-28) 
Seite 7, Zeile 24 -Seite 13, Zeile 37 
Anspruche 1,2,4,6 

W0 93 05183 A (BAYLOR COLLEGE MEDICINE) 
18. Marz 1993 (1993-03-18) 

Seite 3, Zeile 9 -Seite 9, Zeile 25 
Bei spiel 2 

Anspruche 1,2,4,5,9-11 

_/__ 



1-11, 
22-42 



1-9, 
22-33 , 
36-42 



1-9, 

22-33, 

36-42 



)( I Weitere Veroffentlichungen sind der Fonsetzung von FeW C zu 
4 5 entnehmen 



ID 



Siehe Anhang PatentfamiGe 



* Be sonde re Kategorien von angegebenen VerOflentlichungen 

"A" Veroffentiichung. die den allgemeinen Stand derTechnlk definiert, 
aber nicht als besonders bedeutsam anzusehen 1st 

"E* aiteres Dokument, das jedoch erst am Oder nach dem intemationalen 
Anmeldedatum veroffentlicht worden fst 

"L* VerofientGchung, die geeignel ist, elnen Prioritatsanspruch zweifelhaft er- 
scheinen zu lassen, oder durch die das VerOftentlichungsdatum einer 
anderen im Recherchenbericht genannten Veroffentiichung belegt warden 
son oder die aus einem anderen besonderen Grund angegeben 1st (wie 
ausgefQhii) 

"O* VerfiHentfichung. die sich aul eine mundliche Offenbarung, 

eine Benutzung, eine Ausstellung oder andere MaBnahmen beziehl 

"P" Verdflentlichung, die vor dem Intemationalen Anmeldedatum, aber nach 
dem beanspruchten PrioritStsdatum verOffentficht worden 1st 



T" Spfitere Veroffentiichung, die nach dem intemationalen Anmeldedatum 
Oder dem Prioritfitsdatum verdffentDcht worden ist und mit der 
Anmeldung nicht koMdiert. sondern nur zum Verstfindnte des der 
Erfindung zugrundeliegenden Prinztps oder der ihr zugrundeliegenden 
Theorie angegeben isf 

"X* Veroffentiichung von besonderer Bedeutung; die beanspaichte Erfindung 
kann allein aufgrund dieser Veroffentiichung nicht als neu oder auf 
erlinderischer Tatigkeit beruhend betrachtet werden 

"V Veroffentiichung von besonderer Bedeutung; die beanspnjchte Erfindung 
kann nicht als auf erfindertscher Tatigkeit beruhend betrachtet 
werden, wenn die Veroffentiichung mit einer oder mehreren anderen 
VeroffentKchungen dieser Kateoorie in Verbindung gebracht wind und 
diese Verbindung fur einen Facnmann naheiiegend ist 

*&• Verdfientfichung, die Mitglied derselben Patentfamiiie ist 



Datum des Anschluss es der intemationalen Recherche 



23. September 2003 



Name und Postanschrift der Intemationalen RecherchenbehOrde 

Europaisches Patentamt, P.B. 5618 Patenilaan 2 
NL - 2280 HV RljswijX 
Tel. (+31-70) 340-2040. Tx. 31 651 epo nl. 
Fax (+31-70) 340-3016 



Absendedatum des intemationalen Recherchenberichts 



29/09/2003 



Bevollmachtlgter Bediensteter 



Ulbrecht, M 



Formttatl PCTflSA/210 (Rao 2) (Jufi 1992} 



INTERNATIONALER RECHERCHENBERICHT 



Intett fcpnales Aktenzeichen 

PCT/EP 02/09614 



C.(Fort8etzung) ALS WE8ENTUCH ANGESEHENE UNTERLAGEN 



Kategorte 0 



Bezeichnung der Ver6ffentUchung, soweit erlorderilch unter Angabe der In Betracht kommenden Telle 



Betr. Anspruch Nr. 



p,x 



p,x 



WO 02 061127 A (BALASUBRAMANIAN SHANKAR 
; BARNES COLIN (GB); KLENERMAN DAVID (GB); ) 
8. August 2002 (2002-08-08) 
Seite 4, Zelle 13 -Seite 6, Zelle 18 
Seite 10, Zeile 12 - Zelle 28 

W0 02 061126 A (BALASUBRAMANIAN SHANKAR 
; BARNES COLIN (GB); KLENERMAN DAVID (GB);) 
8. August 2002 (2002-08-08) 
Seite 4, Zeile 12 -Seite 5, Zeile 30 
Seite 6, Zeile 30 -Seite 9, Zeile 13 
Anspruche 1-4,9,10 

US 5 547 839 A (FODOR STEPHEN PA ET AL) 
20. August 1996 (1996-08-20) 
in der Anmeldung erwahnt 
Spalte 6, Zeile 15 -Spalte 22, Zeile 65 
Anspruche 1,3 

US 5 302 509 A (CHEESEMAN PETER C) 
12. April 1994 (1994-04-12) 
Spalte 2, Zeile 15 -Spalte 8, Zeile 18 
Anspruche 1-4 

TONISSON N ET AL: "UNRAVELLING GENETIC 
DATA BY ARRAYED PRIMER EXTENSION- 
CLINICAL CHEMISTRY AND LABORATORY 
MEDICINE, WALTER DE GRUYTER UNO CO, DE, 
Bd. 38, Nr. 2, 2000, Seiten 165-170, 
XP001023733 
ISSN: 1434-6621 
das ganze Dokument 

WO 02 088382 A (GENOVOXX GMBH ;TCHERKASS0V 
DMITRI (DE)) 7. November 2002 (2002-11-07) 
Anspruche 27,28 



1-11, 
22-42 



1-11, 
22-42 



1-42 



1-42 



25,26 



34,35 
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INTERNATIONALER RECHERCHENBERICHT 



^fna 



tionales Aktenzeichen 

PCT/EP 02/09614 



Fetd i Bemerkungen zu den Anspruchen, die sich als nicht recherchierbar erwiesen haben (Fortsetzung von Punkt 2 auf Blatt 1 



GemfiG Artikel 1 7{2)a) wurde aus folgenden GrOnden fur bestimmte AnsprQche kein Recherchenbericht erstellt: 
1. ri AnsprOcheNr. 

weil sie sich auf GegenstSnde beziehen, zu deren Recherche die Behdrde nicht verpftichtet ist, ndmtich 



2. H AnsprocheNr. 36 und 37 (teilweise) 

weil sie sich auf Teile der intemationalen Anmeldung beziehen, die den vorgeschriebenen Anforderungen so wenig entsprechen, 
daB eine si nn voile internationals Recherche nicht durchgefuhrt werden kann, namiich 

siehe Zusatzblatt WEITERE ANGABEN PCT/ISA/210 



3. | 1 Anspruche Nr. 

weil es sich dabei urn abhangige Anspruche handelt. die nicht entsprechend Satz 2 und 3 der Regel 6.4 a) abgefaGt sind. 



Feld II Bemerkungen bei mangelnder Einheitlichkeit der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1) 



Die intemationafe Recherchenbehorde hat festgestellt, daB diese intemationale Anmeldung mehrere Erfindungen enthaJt: 



1. I "l Da der Anmelder alle erfordertichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 
< — I intemationale Recherchenbericht auf alle recherchierbaren Anspruche. 



2 ~~| Da fur alle recherchierbaren Anspruche die Recherche ohne einen Arbeitsaufwand durchgefuhrt werden konnte, der eine 
I — ' zusatzliche Recherchengebuhr gerechtfertigt hatte, hat die Behorde nicht zur Zahlung einer solchen GebOhr aufgefordert. 



3. I I Da der Anmelder nur einige der ertordertichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 
' — ' intemationale Recherchenbericht nur auf die AnsprQche, fOr die Gebuhren entrichtet worden sind, namiich auf die 
Anspruche Nr. 



| | Der Anmelder hat die ertordertichen zus&tziichen Recherchengebuhren nicht rechtzeitig entrichtet. Der intemationale Recher- 
chenbericht beschrdnkt sich daher auf die in den Anspruchen zuerst erwdhnte Erfindung; diese ist in folgenden Anspruchen er- 
faQt: 



Bemerkungen hinsichtllch eines Widerspruchs | | Die zusdtziichen GebQhren wurden vom Anmelder unter Widerspruch gezahlt. 

[ [ Die Zahlung zusStzlicher Recherchengebuhren erfolgte ohne Widerspruch. 



Formbtatt PCT/ISA/210 (Fortsetzung von Blatt 1 (1))(Jufi 1998) 



• 



Internationales AktenzeichenPCT^P 02 /)9614 



WEITERE ANGABEN PCT/ISA/ 210 



Fortsetzung von Feld 1.2 

Anspriiche Nr.: 36 und 37 (teilweise) 



Die geltenden Patentanspruche 36 und 37 beziehen sich auf Produkte, 
jeweils charakterisiert durch eine erstrebenswerte Elgenheit Oder 
Eigenschaft, namlich 

- Reaktionslosungen zur Durchfuhrung des Verfahrens (Anspruch 36); 

- Terminationsnukleotide, deren Terminations-Subsituent mit dem 
Fluoreszenzfarbstoff abspaltbar ist (Anspruch 36); 

- Reagenzien zur Erzeugung von Einzelstangen (Anspruch 37) und 

- Reagenzien zur Abspaltung der Substituenten mit den 
Fluoreszenzfarbstoffen (Anspruch 37). 

Der Patentanspruch umfasst daher alle Produkte, die diese Eigenheit Oder 
Eigenschaft aufweisen, wohingegen die Patentanmeldung Stutze durch die 
Beschreibung im Sinne von Art. 5 PCT nur fur eine begrenzte Zahl solcher 
Produkte liefert. Im vorliegenden Fall fehlen den Patentanspruchen die 
entsprechende Stutze bzw. der Patentanmeldung die notige Offenbarung in 
einem solchen MaBe, daB eine sinnvolle Recherche uber den gesamten 
erstrebten Schutzbereich unmoglich erscheint. Desungeachtet fehlt den 
Patentanspruchen auch die in Art. 6 PCT geforderte Klarheit, nachdem in 
ihnen versucht wird, die Produkte uber das jeweils erstrebte Ergebnis zu 
definieren. Auch dieser Mangel an Klarheit ist dergestalt, daB er eine 
sinnvolle Recherche uber den gesamten erstrebten Schutzbereich unmoglich 
macht . 

Daher wurde die Recherche auf die Teile der Patentanspriiche gerichtet, 
welche im o.a. Sinne als klar, gestutzt Oder offenbart erscheinen, 
namlich die Teile betreffend: 

- Terminationsnukleotide, die an der 3'-Position der (Desoxy-)Ribose 
einen termini erenden Substituenten und einen Fluoreszenzfarbstoff tragen; 

- Reagenzien zur Alkali-Denaturierung; 

- Reagenzien zur Abspaltung der Substituenten, wie auf S. 36, Z. 30 - S. 
38, Z. 19 beschrieben. 

Die Reaktionslosungen sind zu unklar und wurden nicht recherchiert . 

Der Anmelder wird darauf hingewiesen, daB Patentanspriiche, Oder Teile von 
Patentanspruchen, auf Erfindungen, fur die kein internationaler 
Recherchenbericht erstellt wurde, normal erweise nicht Gegenstand einer 
internationalen vorlaufigen Prufung sein konnen (Regel 66.1(e) PCT). In 
seiner Eigenschaft als mit der internationalen vorlaufigen Prufung 
beauftragte Behorde wird das EPA also in der Regel keine vorlaufige 
Prufung fur Gegenstande durchfuhren, zu denen keine Recherche vorliegt. 
Dies gilt auch fur den Fall, daB die Patentanspruche nach Erhalt des 
Internationalen Recherchenberichtes geandert wurden (Art. 19 PCT), oder 
fur den Fall, daB der Anmelder im Zuge des Verfahrens gemaB Kapitel II 
PCT neue Patentanspruche vorlegt. 
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